苹果拆解AI大脑,推理模型全是「装」的?Bengio兄弟合著
苹果最新研究揭示了大推理模型在高复杂度任务中的普遍‘推理崩溃’现象,模型在思考路径上虽长但常放弃关键步骤。论文作者Samy Bengio指出,即使是提供明确算法提示也无法稳定执行。
苹果最新研究揭示了大推理模型在高复杂度任务中的普遍‘推理崩溃’现象,模型在思考路径上虽长但常放弃关键步骤。论文作者Samy Bengio指出,即使是提供明确算法提示也无法稳定执行。
谷歌发布了Gemini 2.5 Pro,仅用一个月就碾压了旧版。新版模型在数学、编程和推理方面表现卓越,稳居所有榜单第一。它引入了‘思考预算’功能,并提升了代码生成的质量。
Cursor 1.0发布,推出多项新功能如BugBot自动修复、后台智能体开放等,提升开发者和数据科学家的工作效率。