再看文档古籍修复前沿方案:定位、预测、图像重建三阶段融合思路

2025年7月11日,北京晴。文章介绍了文档智能在历史文献修复中的应用,包括数据合成和三阶段模型(OCR辅助的损坏定位、损坏内容预测、历史外观恢复)。AutoHDR-Qwen2-1.5B等开源项目展示了这种方法的效果。

OCR-Reasoning:揭秘多模态大模型在复杂图文推理中的真实能力

OCR-Reasoning 基准评估多模态大模型在复杂图文信息的深度推理能力,涵盖6种核心推理能力及18种实际任务。数据来源广泛,包括互联网图片和真实世界照片,如金融报告分析、发票识别等。