智能体自己出现问题自己找!首次提出“自动化失败归因”课题 ICML2025 Spotlight

本文介绍了一项新研究,首次提出并定义了’自动化失败归因’这一全新课题。研究人员构建了首个专用基准数据集Who&When,并开发评估了多种自动化归因方法,揭示了Multi-Agent系统中找到责任Agent和错误步骤的复杂性,为提升LLM Multi-Agent系统的可靠性和智能开辟了新的道路。

顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务

新智元报道编辑:peter东 乔杨近日研究发现,即使是最先进的大模型智能体也无法完全应对现实世界中的复杂任务。《Agent Company》项目展示了智能体在虚拟软件公司的运营中所遇到的问题,包括常识缺乏、社交技巧不足以及网页浏览困难等挑战。