老刘说NLP，作者每时AI - 第7页共20页

GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser

2025年6月11日14时作者老刘说NLP

在2025年6月11日的文章中，探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建，并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》，分析了GraphRAG在不同场景下的有效性。

真实场景下文档解析中的2大类8个常见问题：目录层级解析、布局检测、阅读顺序及长表格拼接

2025年6月10日14时作者老刘说NLP

2025年6月10日，北京晴。本文讨论了文档解析处理中的检测问题和语义解析问题，包括布局检测、阅读顺序识别、背景干扰、ppocrv5模型精度、跨页表格合并等问题，并提出了解决方案。

大模型应用推介：多模态RAG、语法纠错、个人财务及Baby Monitor

2025年6月9日14时作者老刘说NLP

2025年6月9日北京晴天，文章介绍了多模态RAG实现流程、AI Baby Monitor应用、用于语法纠错的微调模型及个人财务大模型等内容。

GraphRAG是否总是有效？9大代表方案在GraphRAG-Bench的多维度对比

2025年6月8日14时作者老刘说NLP

aphRAG方案回顾、GraphRAG方案效果对比Benchmark、GraphRAG能否提升所有类

再看知识图谱本体生成：RAG用于Mysql数据转换及非结构化文本生成思路

2025年6月7日14时作者老刘说NLP

今天是2025年6月7日，星期六，北京晴。介绍了两个关于知识图谱本体的工作，一是RAG用于MySQL数据生成知识图谱本体的方法，二是基于非结构化知识库进行本体生成的方法。

有趣思考:如何带着问题去针对性学习-兼看大模型推理、强化、RAG等进展

2025年6月6日14时作者老刘说NLP

今天是2025年6月6日，星期五，北京晴。文章回顾了大模型相关技术进展，包括针对性学习、推理数据收集、多模态应用及强化学习评估偏差等内容。关键点在于明确问题并针对性学习，学会提问和理论与实践结合，以提升大模型性能。

RAG的有趣新尝试:将文本编码进MP4文件实现思路及Agentic-doc处理文档

2025年6月5日14时作者老刘说NLP

今天是2025年6月5日，星期四，北京晴。文章介绍了将文本编码进MP4文件的有趣RAG尝试和Agentic-doc文档处理系统。Memvid项目通过MP4索引实现快速语义搜索，而Agentic-doc则利用agent高效提取复杂文档结构化数据。

强化学习数据合成框架SynLogic及语音大模大模型评估

2025年5月30日14时作者老刘说NLP

2025年5月29日，北京晴。文章介绍了大模型推理及语音模型评估进展和数据合成框架SynLogic的最新情况，包括DeepSeek-R1更新、LALM-Evaluation-Survey项目以及用于生成多样化的逻辑推理数据的SynLogic框架。

RAG和Agent的几张趣图思考及RLI基于自我置信度RL强化学习思路

2025年5月28日19时作者老刘说NLP

2025年5月28日，北京晴。文章探讨了从几张图看RAG及Agent的问题和基于自我置信度作为强化学习监督信号的工作，强调实际业务数据的重要性，并指出不要过度依赖Agent智能体解决问题。

如何用Agent智能体生成论文poster海报？文档版式分析还能用来做什么？

2025年5月27日14时作者老刘说NLP

2025年5月27日星期二，北京晴天。本文讨论了P2P项目如何利用智能体生成研究论文海报的思路与实现细节，并介绍了版式分析在文档搜索和推荐等下游任务中的应用潜力。