多步推理归档

WebDancer：迈向自主信息寻求的智能体

2025年5月30日8时作者 NLP工程化

一种从数据为中心和训练阶段视角构建的端到端智能信息检索代理方法及其在WebWalkerQA上的实验结果

2025年3月28日16时作者新智元

明让AI有时会「胡说八道」，甚至故意撒谎。Anthropic刚刚推出了一项突破性研究，用类似大脑扫描

2025年3月25日11时作者机器之心

大学奥斯丁分校
最新评测基准 SPIN-Bench，用一套 “组合拳” 暴击了大模型的软肋。
研究显