智能体自己出现问题自己找!首次提出“自动化失败归因”课题 ICML2025 Spotlight

本文介绍了一项新研究,首次提出并定义了’自动化失败归因’这一全新课题。研究人员构建了首个专用基准数据集Who&When,并开发评估了多种自动化归因方法,揭示了Multi-Agent系统中找到责任Agent和错误步骤的复杂性,为提升LLM Multi-Agent系统的可靠性和智能开辟了新的道路。

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」!
就在刚刚,我们在未