RAG的2025趋势重点及RAG+抽取场景的来源定位问题思考

2025年6月24日,北京晴天。文章讨论了信息抽取和RAG落地中的引文生成、来源定位需求及其底层逻辑与实际案例。提及模型可能产生“幻觉”导致的误导性答案,通过引文标注来源增强可信度。此外,文章总结了2025年RAG的发展趋势,包括多模态文档解析与统一抽取的重要性。

为什么你的RAG效果差?可能PDF没准备好!

最近搭建了一个图数据库用于RAG系统。相比传统向量搜索,GraphRAG在推理能力上更强。文章讲述了如何从PDF中提取信息构建知识图谱的过程,包括选择合适的工具进行PDF转文本和结构化处理,并使用云服务实现大规模并行处理提高效率。

WaterCrawl: 强大的自托管网络爬虫与数据提取工具 ,GraphRAG与DeepSearch融合的智能问答Agent

本文介绍了五款云端工具与应用:WaterCrawl强大网络爬虫、GraphRAG智能问答Agent、Claudia增强交互体验、cpdown网页转Markdown扩展以及Agents Towards Production GenAI生产实战手册。

GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser

在2025年6月11日的文章中,探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建,并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》,分析了GraphRAG在不同场景下的有效性。

GraphRAG的两个有趣疑问及LLM代表开源开发工具总结

2025年5月24日周六,北京晴天。本文讨论了GraphRAG的两个问题和大模型开源生态全景图的主要研发工具。GraphRAG技术适用于特定场景而非特定领域;而信息抽取任务更适合专门的任务模型。此外,总结期的大模型开源生态强调关键技术和代表项目。

开源本地部署的GraphRAG chatwiki,支持DeepSeek接入微信里的聊天机器人

ChatWiki 是一款国产开源的知识库 AI 问答系统,结合 GraphRAG 知识图谱技术增强查询效率和答案准确性。支持接入多种大模型,并提供多部署方式、文档发布、格式导入等功能,可嵌入业务系统并与第三方数据打通,支持企业级权限管理与生态对接。

重磅,微软LazyGraphRAG正式开源及实现细节剖析!

微软GraphRAG自提出已一年。为解决传统RAG在全局查询总结任务上表现不佳问题,微软多部门联合提出Project GraphRAG,并正式开源GraphRAG项目。LazyGraphRAG通过降低数据索引成本,使用NLP名词短语提取和图形统计优化概念图并提取分层社区结构。微软近期发布了2.0版本的LazyGraphRAG,其技术原理包括使用NLP名词短语提取来识别概念及其共现,并利用图形统计优化概念图和提取分层社区结构。