老刘说NLP，作者每时AI

文档多模态RAG方案哪个更好？9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025年9月1日19时作者老刘说NLP

文章介绍了多模态RAG进展和文档解析进展，包括评估数据集Double-Bench的亮点以及9个嵌入模型、4个MLM模型的选择，并探讨了不同框架的表现差异。同时提到了古籍文档合成工具及其特点。

2025年8月8日19时作者老刘说NLP

2025年8月8日周五，北京下雨。文章介绍了文档OCR研发的手写体数据合成项目和图文混排Benchmark，还提到了前端界面代码转写模型ScreenCoder。

2025年8月5日14时作者老刘说NLP

2025年8月5日，北京晴。本文介绍了一种新的多模态RAG方法MMRAG-DocQA，旨在解决跨页文档中的多模态关联和证据整合问题，通过层级化索引和细粒度检索策略提高问答系统的准确性和一致性。

2025年8月4日14时作者老刘说NLP

2025年8月4日，北京晴天，《On The Role of Pretrained Language Models in General-Purpose Text Embeddings: A Survey》技术总结，涵盖GPTE架构、数据及多模态embedding模型，重点整理9点内容。

2025年8月2日14时作者老刘说NLP

今天是2025年8月2日，星期六，无锡有雨。文章介绍了使用基于图表示的多模态问答方法处理电信文档中的流程图，并讨论了图像分类、图表示生成和检索优化等步骤。

2025年7月27日14时作者老刘说NLP

之一
。这个主要是今天社区有说到Qwen3模型将思考和非思考模型分开的话题，进
而引出了让大模型自己

2025年7月26日14时作者老刘说NLP

步消停了一段时间，所以，我们可以做下归拢，前面做了许多技术总结的，从场景和技术角度。
这次从数据工程

2025年7月25日14时作者老刘说NLP

今天是2025年7月25日，星期五，北京有雨。文章讨论了用于知识图谱问答的多策略图检索思路ByoKG-RAG，并介绍了一些基于大模型的知识图谱问答方案。

2025年7月24日14时作者老刘说NLP

2025年7月24日，北京下雨。本文回顾了六个大模型数据合成工具，并介绍了DatasetLoom平台的功能和核心提示机制，强调了在生成多样化数据时需要考虑的主题控制、难度和长度参数。

2025年7月24日14时作者老刘说NLP

两年来Java开发者们纷纷转向大模型学习，陈旸老师推出《大模型应用开发实战训练》课程帮助掌握AI技术的开发者。