50-200分钟归档

7个月翻一番！AI agent能力飙升，METR报告揭示指数级进化规律

2025年7月16日12时作者量子位

报告指出，大模型在软件开发、数学竞赛等任务上的能力每2-6个月翻一番，表明其正在迈向高度自动化。METR选取9个基准测试评估AI agent的time horizon，发现这些智能体的能力呈现出‘摩尔定律’式的增长趋势。