月度归档: 2025 年 5 月
ICML 2025 Spotlight 谁导致了多智能体系统的失败?首个「自动化失败归因」研究出炉
本文介绍了一篇ICML 2025 Spotlight论文,提出自动化失败归因新任务以快速定位多智能体语言模型(LLM)系统的错误。研究构建首个Who&When数据集,并比较了三种方法:All-at-Once、Step-by-Step和Binary Search。实验结果显示当前方法效果有限,准确率较低;但混合策略有一定提升,且现有SOTA模型表现仍不理想。这表明失败归因任务对AI推理与理解能力要求极高。
美国最新报告!DeepSeek成全球第二大AI实验室,OpenAI谷歌坐不住了
DeepSeek凭借新版R1模型跃升至全球第二大AI实验室,并在开源领域取得领先优势。其在多项评估中得分显著提升,特别是在编程和数学能力方面表现突出。
谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍
Fast-dLLM 提出分块 KV 缓存和置信度感知并行解码技术,显著提升扩散模型推理速度至原速的 27.6 倍,同时保持较高生成精度。