5 月 2025 - 第39页共241页

两岁的Llama，最初的14位作者已跑了11个！Mistral成最大赢家

2025年5月27日16时作者机器之心

帮助该公司制定了 AI 战略，某种程度上也改变了全世界的大模型格局。然而，令人意想不到的是，短短几年

2025年5月27日16时作者 Founder Park

宣传不符，在测试集上进行训练的「丑闻」之后，Meta 近期又被爆出其 AI 团队的近八成员工已离职。

2025年5月27日16时作者新智元

Meta发布KernelLLM，一个基于Llama 3.1微调的8B模型，能够在PyTorch代码基础上生成高效的Triton GPU内核，单次推理性能超越GPT-4o和DeepSeek V3。

2025年5月27日16时作者量子位

亚马逊工程师因使用AI写代码导致工作量增加、效率提高但质量下降，迫使他们成为‘代码审核员’。员工表示不得不依赖AI才能跟上项目进度，否则绩效会受影响，甚至可能被毕业。

2025年5月27日16时作者新智元

谷歌通过AI Overviews和AI Mode大幅削弱用户点击网站的需求，导致搜索结果从信息入口变为信息终点。这引发了谷歌自身商业模式的危机，并预示着传统搜索引擎可能走向终结。

2025年5月27日16时作者量子位

阿里开源的QwenLong-L1模型在HuggingFace今日热门论文第二，其32B参数版本性能优秀。对比基础模型，QwenLong-L1通过回溯和验证机制成功处理了长文本推理中的干扰信息问题，准确计算了金融文档中涉及优先票据发行成本与第一年利息支出合并的总资本成本。

2025年5月27日16时作者机器之心

北京大学宋国杰教授团队综述论文首次系统梳理大语言模型心理测量学，提出三大革新方向，涵盖评估原则变革、新范式设计与应用项目反应理论。

2025年5月27日16时作者机器之心

上海交大等团队推出Visual-ARFT项目，专为视觉语言模型设计多模态智能体训练方法，实现图像理解与操作能力。项目开源并测试表明其在复杂任务中超越GPT-4o，展现强大工具调用和推理能力。

2025年5月27日16时作者新智元

华为诺亚提出的Pangu Light框架，一举打破了「剪枝即降智」魔咒，揭示出LLM瘦身的新路径。毫

2025年5月27日16时作者 PaperWeekly

现。但过度依赖思维链（CoT）推理会降低模型性能，产生冗长输出，影响效率。
研究发现，长 CoT 推