7个月翻一番!AI agent能力飙升,METR报告揭示指数级进化规律

报告指出,大模型在软件开发、数学竞赛等任务上的能力每2-6个月翻一番,表明其正在迈向高度自动化。METR选取9个基准测试评估AI agent的time horizon,发现这些智能体的能力呈现出‘摩尔定律’式的增长趋势。

老黄投了个120亿美元最贵种子轮!但小钱:H20中国开卖,市值一夜暴涨1600亿美元

硅谷史上最大种子轮诞生,Thinkig Machines Lab获20亿美元融资估值120亿美元。公司由OpenAI前CTO Mira Murati创立,英伟达等芯片厂商参与投资。该公司专注于构建一个让每个人都能获得知识和工具的未来。

开放世界任务成功率82%!美的攻克机器人泛化控制难题

美的AI研究院和华东师范大学联合提出ChatVLA-2模型,具备开放世界具身推理能力。通过动态混合专家架构和双阶段训练策略,模型在数学匹配游戏和玩具摆放任务中展示出色表现,成功率达82%。

国产Deep Research杀出一匹「裸奔」黑马:免费开放,过程透明,网页报告一键即出

国产AI搜索明星玩家秘塔AI搜索发布深度研究功能,提供免费、无需申请的便捷使用。支持多维度信息检索和交互式报告生成,覆盖广泛且详细的内容分析,获得多项测试最优评价。