今天是2025年4月24日,星期四,北京,晴。
今天我们来看两个问题,一个是检索增强生成(RAG)与推理(Reasoning)的结合必要性及范式,这个也是前沿热点。
另一个是,看看Agents、RAG产品及大模型安全的一些新总结,可以找一些思路。
抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油。
一、RAG与Reasoning结合的必要性及实现范式
最近RAG开始搭上推理Reasoning的东风,从技术角度上不断推陈出新,如何更好的结合,受到广泛关注。

最近的王昊奋老师团队的工作 《Synergizing RAG and Reasoning: A Systematic Review》(https://arxiv.org/abs/2504.15909)不错,主要探讨了检索增强生成(RAG)与推理能力结合的一些具体内容,我们来看两个点,一个是结合必要性,一个是结合范式,内容很多,新的概念也不少,可以作为科普读物。

1、检索增强生成(RAG)与推理(Reasoning)的结合的必要性

主要从Reasoning-Augmented Retrieval(推理增强检索) 和 Retrieval-Augmented Reasoning(检索增强推理)两个方面来看,这是两个概念。

1)Reasoning-Augmented Retrieval(推理增强检索)
推理如何通过逻辑分析和动态调整来优化检索过程。具体的:
一个是动态查询扩展(Dynamic Query Expansion),推理可以基于查询的上下文和逻辑关系动态生成更精确的检索请求。例如,对于一个复杂的查询,推理可以分解为多个子查询,并逐步检索相关信息。例如,对于复杂的查询,如“如何降低糖尿病患者的术后感染风险”,推理可以分解为多个子查询(如“血糖控制阈值”和“抗生素使用指南”),并通过检索逐步构建答案。
一个是意图消歧(Intent Disambiguation),推理能够理解查询背后的隐含意图,从而更准确地选择检索策略。例如,对于一个模糊的查询,推理可以通过上下文分析来确定用户的真实需求。
一个是多跳证据聚合(Multi-hop Evidence Aggregation),推理可以处理多跳依赖,通过逐步检索和验证中间结果来构建完整的证据链。例如,在回答一个需要多步推理的问题时,推理可以先检索相关的背景信息,再逐步构建答案。
一个是领域适应(Domain Adaptation),推理可以根据具体的领域需求调整检索策略,确保检索结果与领域知识和数据模式一致。例如,在金融或医疗领域,推理可以生成符合领域规范的检索请求。
2)Retrieval-Augmented Reasoning(检索增强推理)
检索如何通过提供外部知识来增强推理的深度和广度。具体的:
一个是动态知识补充(Dynamic Knowledge Supplementation),推理过程中可以根据需要实时检索相关的外部知识,确保推理的每一步都有充分的依据。例如,在进行多步骤推理时,检索可以提供必要的中间知识,避免知识缺口。
一个是推理路径优化(Reasoning Path Optimization),检索可以帮助推理选择最优的路径,通过验证和筛选候选推理路径来减少无效或错误的推理。例如,通过知识图谱的检索,推理可以快速找到相关的逻辑关系。
一个是领域适应(Domain Adaptation),检索可以提供特定领域的知识,帮助推理更好地处理专业领域的复杂问题。例如,在工业问题解决中,检索可以提供相关的技术文档和数据,支持推理的决策。
一个是动态知识需求(Dynamic Knowledge Requirements),推理过程中对知识的需求是动态变化的,检索可以根据推理的进展实时提供所需的知识。例如,在多步骤推理中,检索可以逐步提供新的知识,支持推理的每一步。
2、检索增强生成(RAG)与推理(Reasoning)的结合方式
根据流程的动态性,可以将RAG+Reasoning系统分为两类。

一类是预定义工作流(Pre-defined Workflow),使用固定模板,系统地交替检索和推理阶段,干预点在检索前推理(例如,查询分解)、检索后推理(例如,证据合成)或混合阶段预先确定。
其中:
在检索前推理中,推理过程在检索之前进行,目的是通过逻辑分析和语义增强来优化查询。具体方法包括:查询优化(Query Optimization):生成和选择查询变体,以最大化检索的相关性。例如,通过对比训练或强化学习来优化查询;属性判断(Attribute Judgment):通过分类机制动态调节检索触发条件。例如,根据查询的复杂性和时效性来决定是否进行检索;计划生成(Plan Generation):将复杂查询分解为结构化的子任务序列,以指导检索方向。例如,通过链式推理来对齐检索目标与多步骤问题解决的要求;语义增强(Semantic Enhancement):使用领域特定或任务感知的嵌入来丰富查询表示,提高跨模态检索的鲁棒性。
在检索后推理(Post-Retrieval Reasoning)中,在从外部源检索信息后进行处理。这种方法解决传统RAG在管理知识冲突、缓解信息不足和增强复杂推理任务中的逻辑一致性方面的固有限制。具体方法包括:迭代多步骤推理,交替进行图检索和上下文检索,通过LLM的推理判断逐步扩展实体并修剪无关信息,最终生成准确答案;结构化知识同化,通过多指令微调策略增强外部知识对LLM内部表示的校正效果,减少幻觉生成的可能性。
在混合推理(Hybrid Reasoning)中,将预检索推理和检索后推理结合起来,形成一个复合处理范式,通过多轮递归迭代过程,将检索、生成和推理作为结构化的复合操作执行。
一类是动态工作流(Dynamic Workflow),实施基于状态的推理过程,检索行为通过系统的持续自我检查有条件地触发。
这种范式进一步分为主动性驱动推理(Proactivity-Driven Reasoning),模型基于内部评估自主触发行动,无需外部干预;反思性驱动推理(Reflection-Driven Reasoning),通过自我检查中间结果质量动态启动后续操作;反馈性驱动推理(Feedback-Driven Reasoning):通过外部模型或规则系统对中间状态进行实时评分并提供纠正建议。
3、RAG和推理结合存在的主要问题
从大模型(LLM)到检索增强生成(RAG),再到RAG+推理,性能的提升伴随着额外的成本,这是必然的,并且还很难控制。

例如,如果将现有的一些技术方案进行归类,那么就可以归为如下象限,所以并不一定要为了结合而结合,还是需要具体问题具体分析,做具体选择。

二、Agents、RAG产品及大模型安全的一些新总结
1、关于Agents还是Workflows?
Agents还是Workflows?LangChain创始人和OpenAI杠上了。LangChain创始人与OpenAI就Agent框架设计理念产生争议,认为不应将Agents和Workflows严格二分,大多数Agentic系统是两者结合;他指出Agent框架核心难点是确保LLM在每步都能获得恰当上下文,而非仅提供封装,框架应支持从结构化工作流到模型驱动的灵活转换;

但是,很多框架的作者都站出来说hwchase 对自己的框架没有深入了解就打❌了。然后还有认知不同的争吵,比如 Imperative 的定义问题。https://blog.langchain.dev/how-to-think-about-agent-frameworks/,https://x.com/hwchase17/status/1914016302261506421
2、关于RAG产品思路,meta search的学习功能,https://metaso.cn/study。

大致处理流程位:用户输入想学的知识点->解析成关键词->搜索相关文献->文献整理生成ppt->ppt进行讲解语音播报->此外提供推荐文献、文献翻译功能。
3、关于大模型agent中的安全
继续关注安全进展,可以看看最近的工作 《A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment》(https://arxiv.org/pdf/2504.15585)

涵盖LLM及其智能体从数据到应用全生命周期的“全栈安全”框架,系统回顾了各阶段的攻击、防御与评估现状。
例如,在实际应用过程中遇到的安全问题。

又如,实际在预训练过程中常用的方案。

参考文献
1、https://arxiv.org/abs/2504.15909
(文:老刘说NLP)