多模态大模型在OCR生成上表现如何?多页文档理解数据集Doc-750K

2025年7月23日,北京晴。文章介绍了多模态大模型在OCR生成任务和长文档问答数据集方面的进展。前者评估了最新多模态模型在多种OCR生成任务上的表现;后者则针对多页理解问题,通过开源数据集Doc-750K研究提升模型处理复杂文档的能力。

大模型长文生成思路:融合多模态配图+细粒度引用方案-DeepWriter

2025年7月22日,北京晴。文章介绍了《DeepWriter》的工作思路和设计方法,包括分层知识表示、结构化写作流程、多模态内容融合以及细粒度引用等关键点,并详细讨论了离线知识库构建与在线写作流程中的核心技术。