多模态RAG前沿速读:三看SimpleDoc双线索实现思路
2025年6月19日,北京晴。介绍SimpleDoc多模态RAG方案,结合视觉嵌入和LLM生成的摘要来检索相关页面,并迭代更新查询以改进答案。结果显示其在4个DocVQA数据集上表现优于基准模型。
2025年6月19日,北京晴。介绍SimpleDoc多模态RAG方案,结合视觉嵌入和LLM生成的摘要来检索相关页面,并迭代更新查询以改进答案。结果显示其在4个DocVQA数据集上表现优于基准模型。
今天是2025年6月20日,星五,北京,晴。继续看代码中的表格RAG项目,解决的问题是从大量表中检索相关表。思路有点怪,输入用户查询后先过滤大表,再补充额外特征信息送LLM生成答案,尽管设计不合理但仍有可借鉴之处。
2025年6月18日星期三,北京晴天,《GraphRAG-Agent》项目推介介绍了一种结合可解释性和推理能力的问答系统,涵盖多步搜索、证据追踪及可视化展示等特性。
老刘说NLP技术社区致力于通过早报、讨论、分享等多种形式,围绕大模型、RAG、文档智能和知识图谱等主题提供技术内容。该社区还提供了包括专题课程、系列文章及可视化图解在内的多种学习资源,并对成员权益进行了详细说明。
今天是2025年6月16日,星期一,北京晴。文章提到了DeepResearch Bench评测和E^2GraphRAG提速思路的两个项目。DeepResearch Bench包含100个博士级别任务,评估了四种早期发布的Agent。而E^2GraphRAG提出了在索引阶段构建摘要树和实体图,并在检索阶段利用自适应检索策略来提高效率和效果。
2025年6月17日,北京晴。文章总结了文档解析中的实际问题,包括目录层级解析、布局检测、阅读顺序及长表格拼接等8个小问题,并探讨了先做版面分析、多任务模型的经典显存问题、下划线解码等问题。
今天是2025年6月15日,星期天,北京晴朗。本文介绍了一种纯LLM驱动的知识图谱三元组及Schema提取方案,该方法源自《AutoSchemaKG: Autonomous Knowledge Graph Construction》,通过模式归纳获得实体、事件和关系的类型,核心在于大量的prompt提示来构建知识图谱,并进行了成本效益分析。
今天是2025年6月13日,星期五,北京晴天。文章介绍了三种embedding编码范式(Bi-encoders、Cross-encoder、ColBERT)及其对比,并探讨了知识图谱与RAG结合在问答系统中的应用,重点介绍《KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs》的研究工作及其步骤。
今天是2025年6月12日,星期四,北京晴。文章介绍了两种PPT生成方案AutoPresent和SlideCoder,前者通过微调LLAMA模型生成Python代码,后者使用布局感知的检索增强生成框架,包含层次化检索增强生成、图像分割等技术。
2025年6月11日,北京晴。文章介绍了MCP的9个代表项目流程和开源大模型进展,包括DeepSeek-R1的蒸馏Qwen3-32B和MiniCPM4系列端侧大模型。