表格RAG项目解读:一个过滤+澄清补充的数据工程式思路

今天是2025年6月20日,星五,北京,晴。继续看代码中的表格RAG项目,解决的问题是从大量表中检索相关表。思路有点怪,输入用户查询后先过滤大表,再补充额外特征信息送LLM生成答案,尽管设计不合理但仍有可借鉴之处。

聚焦RAG&KG&LLM&文档解析四大领域:老刘说NLP技术社区对外纳新

老刘说NLP技术社区致力于通过早报、讨论、分享等多种形式,围绕大模型、RAG、文档智能和知识图谱等主题提供技术内容。该社区还提供了包括专题课程、系列文章及可视化图解在内的多种学习资源,并对成员权益进行了详细说明。

GraphRAG提速新思路E^2GraphRAG及DeepResearch Bench评估结果

今天是2025年6月16日,星期一,北京晴。文章提到了DeepResearch Bench评测和E^2GraphRAG提速思路的两个项目。DeepResearch Bench包含100个博士级别任务,评估了四种早期发布的Agent。而E^2GraphRAG提出了在索引阶段构建摘要树和实体图,并在检索阶段利用自适应检索策略来提高效率和效果。

再思考文档解析最新趋势方案及7类真实场景下文档解析Badcase记录

2025年6月17日,北京晴。文章总结了文档解析中的实际问题,包括目录层级解析、布局检测、阅读顺序及长表格拼接等8个小问题,并探讨了先做版面分析、多任务模型的经典显存问题、下划线解码等问题。

纯Prompt提示LLM的多阶段知识图谱三元组抽取及Schema生成方案

今天是2025年6月15日,星期天,北京晴朗。本文介绍了一种纯LLM驱动的知识图谱三元组及Schema提取方案,该方法源自《AutoSchemaKG: Autonomous Knowledge Graph Construction》,通过模式归纳获得实体、事件和关系的类型,核心在于大量的prompt提示来构建知识图谱,并进行了成本效益分析。

三种主流文本嵌入编码范式及KG-Infused RAG做问题扩展新思路

今天是2025年6月13日,星期五,北京晴天。文章介绍了三种embedding编码范式(Bi-encoders、Cross-encoder、ColBERT)及其对比,并探讨了知识图谱与RAG结合在问答系统中的应用,重点介绍《KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs》的研究工作及其步骤。

如何用大模型自动生成PPT?AutoPresent及SlideCoder方案

今天是2025年6月12日,星期四,北京晴。文章介绍了两种PPT生成方案AutoPresent和SlideCoder,前者通过微调LLAMA模型生成Python代码,后者使用布局感知的检索增强生成框架,包含层次化检索增强生成、图像分割等技术。