2025-04-26 | AI每日速报

今日AI焦点:Anthropic启动模型’福祉’研究引思考,Adobe升级Firefly创意工具,xAI拟融资200亿美元;微软、OpenAI进展动态,Google发布Recall功能和ZAPBench数据集。

一篇142页全面复盘DeepSeek R1思考推理技术综述

通过分类体系分析DeepSeek-R1的推理模块及其在不同任务中的表现,揭示了推理链条的结构一致性、反刍行为和长度对性能的影响,并发现存在一个“最佳点”来优化模型性能,同时探讨了长文本处理与人类认知负荷的关系。

METR发现 AI 编码的“摩尔定律”?指数级增长或颠覆软件开发

文章概述了AI系统处理编码任务的能力以指数速度增长,METR机构的最新研究显示,在2019到2025年间,AI能完成的任务时长上限几乎每7个月翻一番。未来预测指出,AI可能在几年内就能完成数周乃至一个月的工作。