代码类型的RAG做chunk切分怎么做?兼看改进AST方案

2025年6月21日,北京晴。代码RAG的切分方法包括基于语法结构和逻辑块的切分策略,以及混合策略。前者破坏语义完整性,后者在保留功能性和连贯性方面表现不佳。改进方案cAST使用抽象语法树进行递归分割,结合贪婪合并以提高信息密度,并通过非空白字符数量来衡量块大小。

大模型才是智能体的核心,智能体的所有操作都是基于大模型完成的——智能体的执行过程

开发智能体的关键是大模型、Prompt和工具三者结合。Prompt引导模型理解和执行特定任务,工具提供具体操作手段。智能体的核心流程包括需求理解、工具选择与使用、结果分析及问题解决。

谷歌 Gemini 2.5 技术白皮书来了:顶级推理、百万上下文、多模态理解

谷歌发布Gemini 2.5系列模型,包含Pro、Flash和Flash-Lite三个版本。Pro版支持多模态输入、超长上下文处理能力;Flash版优化推理速度与成本效率;Flash-Lite版主打极低延迟和高性价比。Gemini 2.5 Pro采用稀疏激活MoE架构、大规模TPU v5p训练及强化学习控制的思维路径,显著提升性能与效率。测试显示其在编程、数学等领域能力全面提升,并具备多模态任务合成与创作输出的能力。

通杀主流LLM!用知识图谱“撬开”大模型安全门,黑盒越狱新范式HBS-KGLLM发布

南京航空航天大学团队提出HBS-KGLLM框架,通过增强知识图谱挖掘有害信息结构化知识,实现有效探测LLMs的安全性能。该方法成功率高、成本低,并已在多款主流模型上测试表现优异。