思维链归档 - 每时AI

又一华人逃离OpenAI！“思维链第一人”加入Meta

2025年7月16日23时作者智东西

OpenAI两位核心研究员Jason Wei与Hyung Won Chung确认离职并加盟Meta新成立的超级智能实验室。两人均是推理和强化学习的核心研究员，此前曾主导或参与多项研究项目及模型研发。

Jason Wei也被小扎带走：思维链开创者、o1系列奠基人！这次真挖到OpenAI大动脉了

2025年7月16日16时作者量子位

Jason Wei，OpenAI思维链技术的提出者和关键人物之一，被曝即将加入Meta。在此之前，OpenAI多位重要成员已转投Meta，引起业界关注。

概率统计机制下，LLM 推理真的「理解世界了」吗？

2025年6月22日11时作者机器之心

本周会员通讯解读了2个AI & Robotics业内要事。首先讨论了概率统计机制下LLM推理的真实情况，涉及简单复读和显性路径在推理中的角色、Next Token Prediction的动态建模过程以及因果理解的表达。其次探讨了企业如何使用AI采购预算，并分析了从自行构建转向购买第三方应用的原因。通讯还包含2项专题解读及31个要事速递。

奥特曼ChatGPT用法错了！最新研究：要求“直接回答”降低准确率，思维链提示作用也在下降

2025年6月9日16时作者量子位

沃顿商学院研究发现，奥特曼喜爱的直接回答提示词会显著降低模型准确率。同时，思维链（CoT）命令的效果也有限，并且可能导致答案不稳定增加计算成本。

打破思维链推理瓶颈！“软推理”让大模型学会人类抽象能力，token使用量还更少了

2025年5月24日16时作者量子位

研究提出Soft Thinking方法，让模型在连续的概念空间中进行“软推理”，打破基于离散token的推理瓶颈。相比标准CoT，最高提升Pass@1平均准确率2.48%，减少token使用量22.4%。

「R1时刻」降临！港中文MMLab定义文生图新范式，彻底告别“无脑画图”

2025年5月14日16时作者 PaperWeekly

最近的大语言模型在数学和编程等领域展示了强大的推理能力，通过强化学习使用思维链逐步分析问题。本文介绍了一种新的方法将这种策略应用于图片生成任务中，提出了两种不同的层次的思维链（CoT）：Semantic-CoT负责设计图像的整体结构，而Token-CoT则专注于逐块生成细节。通过使用强化学习优化这两个层次的CoT，并引入多个视觉专家模型作为奖励模型来评估生成的图片质量，最终提出了一种新的文生图模型T2I-R1，显著提高了模型生成符合人类期望的结果的能力。

谷歌放大招！新版 Gemini 2.5 Pro 碾压 Claude、GPT，地表最强 AI 来了？

2025年5月8日14时作者 AI信息Gap

谷歌在I/O开发者大会上发布了新版Gemini 2.5 Pro Preview，该模型已在网页版、App端和开发者平台全面上线，并提供免费的25次每日使用额度。它被认为目前是地表最强且免费的多模态模型，尤其擅长编程任务。此外，新版还支持100万 tokens 上下文，具备强大的推理能力和前端UI优化能力。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31