杜克大学归档

智能体自己出现问题自己找！首次提出“自动化失败归因”课题 ICML2025 Spotlight

2025年6月11日11时作者量子位

本文介绍了一项新研究，首次提出并定义了’自动化失败归因’这一全新课题。研究人员构建了首个专用基准数据集Who&When，并开发评估了多种自动化归因方法，揭示了Multi-Agent系统中找到责任Agent和错误步骤的复杂性，为提升LLM Multi-Agent系统的可靠性和智能开辟了新的道路。

2025年1月26日12时作者新智元

新智元报道编辑：peter东乔杨近日研究发现，即使是最先进的大模型智能体也无法完全应对现实世界中的复杂任务。《Agent Company》项目展示了智能体在虚拟软件公司的运营中所遇到的问题，包括常识缺乏、社交技巧不足以及网页浏览困难等挑战。

2024年12月2日13时作者机器之心

研究团队提出自驱动 Logits 进化解码（SLED）方法，提升大语言模型事实准确性，无需外部知识库和额外微调。

2024年11月27日23时作者多知

OpenAI资助杜克大学研究项目，旨在解决人工智能道德问题。