老刘说NLP，作者每时AI

SIGIR 2025 LiveRAG竞赛获奖方案及中文文档版式分析的标签设计

2025年7月7日14时作者老刘说NLP

2025年7月7日星期一北京晴，小暑注意防暑。文档智能进展包括版式分析标签问题和RAG竞赛方案；现有中文文档版式分析的标签体系主要有360layoutanalysis、doclayout和PP-DocLayout；SIGIR 2025 LiveRAG竞赛有多个获奖方案介绍，如TopClustRAG、RMIT–ADM+S等。

6个无代码LLM、Agent、RAG开源工具及推理大模型用于时间序列预测工作

2025年7月6日14时作者老刘说NLP

今天是2025年7月6日，星期日，北京晴天。文章介绍了六个无代码LLM、Agent和RAG开源工具，并探讨了使用推理大模型进行时间序列预测的方法及其奖励函数设计。

NLP之文本纠错开源大模型：兼看语音大模型总结

2025年7月5日14时作者老刘说NLP

2025年7月5日周六，北京晴天。介绍了中文拼写和语法纠错的大模型及其开源工具，包括14种错误类型支持，并提供了多个版本的训练数据集和代码。同时总结了语音大模型的技术进展，涵盖了50多种语音语言模型的数据集、tokenizer以及主流模型资源。

再看大模型数据合成开源工具–DataFlow及自然场景文档解析评估问题

2025年7月4日14时作者老刘说NLP

2025年7月4日，北京晴。文章介绍了数据合成工具Easy Dataset和DataFlow，后者支持多种数据源的解析与处理，并涵盖纯文本、强推理等任务。此外，探讨了自然场景文档解析评估问题，强调WildDoc数据集的重要性及其在现实世界扭曲下的表现。

Agent做多模态RAG方案-MDocAgent及文档解析中的图像前处理问题

2025年7月3日14时作者老刘说NLP

2025年7月3日星期四，北京下雨。介绍了多模态RAG进展，包括ColBERT和ColPali的局限性及标准框架问题。提出使用Agent进行内容过滤，并讨论了文档预处理，特别是非印刷体文档标准化的重要性。文章还提到MDocAgent项目及其五个专门智能体的工作流程和架构选型。同时探讨了文档图像增强问题，介绍了DocRes模型及其统一五种文档图像还原任务的通用模型。