7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM Transformer作者团队
Sanaka AI提出的新方法通过让教师模型输出清晰解释来改进教学效果,其7B小模型在传授推理技能方面超越了671B的DeepSeek-R1。这种方法不仅有效还经济高效,并且能与传统强化学习技术结合使用。
Sanaka AI提出的新方法通过让教师模型输出清晰解释来改进教学效果,其7B小模型在传授推理技能方面超越了671B的DeepSeek-R1。这种方法不仅有效还经济高效,并且能与传统强化学习技术结合使用。
Meta CEO Mark Zuckerberg曾与Runway AI讨论可能收购事宜,但未达成正式报价。扎克伯格积极招募AI人才并投资企业,包括对Scale AI的投资和对Perplexity的谈判。Runway AI估值超过30亿美元,其逼真视频生成技术成为行业领导者。Meta正寻求在人工智能领域扩大影响力。
2025中国AI算力大会在6月26日举办,涵盖高峰论坛、AI推理算力专题论坛等。行云集成电路余洪敏将分享《大模型一体机的设计思考与实践》演讲。主会场设有多个分会场和展览区。
OpenAI与io公司因耳机和AI硬件研发引发商标侵权和技术抄袭纠纷,iyO指控其采购30套耳机用于技术拆解研究,并试图收购或合作失败。双方均否认侵权行为,法院要求强制下架宣传视频。