0.35秒OCR整页文档,比Qwen2.5 VL高出10%的文档转换多模态模型!

SmolDocling 是一种高效文档转换的多模态图文到文本模型,由IBM Research联合推出,在A100 GPU上每页仅需0.35秒完成处理,并使用256M参数比Qwen2.5 VL更高效。其功能特性包括高效的文档表示、光学字符识别、布局和定位保留、代码识别、公式识别、图表识别及表格识别等。

超越o1&QwQ-32B,中科院SolutionRAG大幅提升复杂工程方案设计能力

中科院&通义实验室提出并开源了基于树状探索和双点思维的系统SolutionRAG,用于评估多约束复杂工程问题上的解决方案生成能力。该系统在SolutionBench上取得了最先进的性能,并显著优于现有方法,有望提升实际应用中的工程方案设计自动化和可靠性。

Manus 引爆 AI 热潮,你的技术知识已 “过期”?

最近朋友圈被 Manus 刷爆,它能快速生成电影级 CG、训练数字人、筛选简历及24小时带货等。但技术突破引发焦虑,开发者感叹转型困难。为此,DeepSeek 推出系列课程帮助从零开始学习 AI 大模型,涵盖新手装备站和实战经验等内容。