7个月翻一番!AI agent能力飙升,METR报告揭示指数级进化规律

报告指出,大模型在软件开发、数学竞赛等任务上的能力每2-6个月翻一番,表明其正在迈向高度自动化。METR选取9个基准测试评估AI agent的time horizon,发现这些智能体的能力呈现出‘摩尔定律’式的增长趋势。

Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

AI智能体在完成50%任务时所需时间每隔约7个月减少一半,研究团队提出了这一现象为‘智能体摩尔定律’,预测未来AI模型可能在2028年或2031年前后能够自动完成人类目前一个月才能完成的任务。