经典问题之Graph可以如何与Agent结合?从单点到全面归纳

今天是2025年7月12日,星期六,北京,雨。Graph和Agent的结合是社区的重要方向之一。文章回顾了Graph与Agent结合的相关技术进展,包括使用图数据库提升代理记忆管理、优化多Agent协调以及实现基于知识图谱的任务规划与执行等方向。

再看文档古籍修复前沿方案:定位、预测、图像重建三阶段融合思路

2025年7月11日,北京晴。文章介绍了文档智能在历史文献修复中的应用,包括数据合成和三阶段模型(OCR辅助的损坏定位、损坏内容预测、历史外观恢复)。AutoHDR-Qwen2-1.5B等开源项目展示了这种方法的效果。

技术总结之RAG用于文档信息抽取及多模态大模型两阶段训练范式

2025年7月9日,北京晴天。文章总结了SIGIR 2025 LiveRAG竞赛的评测报告,并介绍了信息抽取和多模态大模型训练的相关方案。强调在轮子同质化背景下,业务know-how的重要性,指出文档解析、RAG及大模型应用出现同质化严重现象。同时提到了两个大模型训练指引资源。

文档解析类数据合成工具:7个可用的OCR及文档版式、表格数据开源项目

今天回顾了文档版式及表格数据合成的相关工具和技术。其中包括7个OCR合成数据工具和2种文档版式及表格数据合成工具。这些技术将在实际工作中应用,助力提升效率。老刘也分享了自己的开源项目及其心得。

SIGIR 2025 LiveRAG竞赛获奖方案及中文文档版式分析的标签设计

2025年7月7日星期一北京晴,小暑注意防暑。文档智能进展包括版式分析标签问题和RAG竞赛方案;现有中文文档版式分析的标签体系主要有360layoutanalysis、doclayout和PP-DocLayout;SIGIR 2025 LiveRAG竞赛有多个获奖方案介绍,如TopClustRAG、RMIT–ADM+S等。

NLP之文本纠错开源大模型:兼看语音大模型总结

2025年7月5日周六,北京晴天。介绍了中文拼写和语法纠错的大模型及其开源工具,包括14种错误类型支持,并提供了多个版本的训练数据集和代码。同时总结了语音大模型的技术进展,涵盖了50多种语音语言模型的数据集、tokenizer以及主流模型资源。