比RAG高出8.9%，百度TURA：让搜索引擎“动”起来的下一代AI Agent架构

1. 为什么传统 RAG 不够用了？

TURA（Tool-Augmented Unified Retrieval Agent）用工具调用把 RAG 从“静态阅读”升级为“动态交互”。核心分为三步：

阶段	关键模块	一句话总结
① 检索	Intent-Aware MCP Server Retrieval	把用户一句话拆成多个“小意图”，再从上千个工具里秒选最相关的几个。
② 规划	DAG-based Task Planner	把小意图画成有向无环图（DAG），让能并行的步骤一起跑，省时间。
③ 执行	Distilled Agent Executor	用“小模型”蒸馏“大模型”的推理能力，既快又准地调用工具拿结果。

复杂查询不再是线性流水，而是并行图。
例：订酒店 & 查天气互不依赖，可以同时跑；路线规划需等前两者完成后才启动，节省 44% 延迟（表 6）。

秘诀：训练时保留思维链，推理时直接出动作，既省 token 又保智商。

TURA 用“检索 + 规划 + 工具调用”的三板斧，把只能查资料的 RAG 变成能订票、能规划、能交互的 AI 搜索体，已在百度亿级流量场景跑通，为下一代对话式搜索树立了新范式。

https://arxiv.org/pdf/2508.04604TURA: Tool-Augmented Unified Retrieval Agent for AI Search

（文：PaperAgent）