7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM Transformer作者团队

Sanaka AI提出的新方法通过让教师模型输出清晰解释来改进教学效果,其7B小模型在传授推理技能方面超越了671B的DeepSeek-R1。这种方法不仅有效还经济高效,并且能与传统强化学习技术结合使用。

速递|扎克伯格AI“猎才计划”再遇变量,Meta收购Runway谈判搁浅

Meta CEO Mark Zuckerberg曾与Runway AI讨论可能收购事宜,但未达成正式报价。扎克伯格积极招募AI人才并投资企业,包括对Scale AI的投资和对Perplexity的谈判。Runway AI估值超过30亿美元,其逼真视频生成技术成为行业领导者。Meta正寻求在人工智能领域扩大影响力。