SmolDocling-256M-preview 归档

专注于将图像文档转换为结构化文本SmolDocling

2025年3月25日23时作者 GitHubStore

IBM Research 的 SmolDocling-256M-preview 是一个多模态文档处理模型，专注于将图像文档转换为结构化文本，并支持 OCR、代码块识别、数学公式转换和表格/图表解析等。其核心特性包括高效处理和精准元素识别，具备轻量级模型（基于 2.56 亿参数的 Idefics3 架构）以及开源协议。

SmolDocling-256M-preview 是一个多模态的图像-文本到文本模型

2025年3月19日8时作者 NLP工程化

SmolDocling-256M-preview 是一个多模态的图像-文本到文本模型，专为高效的文档转换而设计，能够处理科学和非科学文档。

SmolDocling-256M多模态OCR识别，用于治疗推理的智能体TxAgent，

2025年3月18日11时作者每日AI新工具

SmolDocling-256M-preview高效文档转换模型，支持多种元素识别和转换。OpenSearch-SQL无需额外训练提升文本到SQL生成准确性。MarkPDFDown精准将PDF转为Markdown格式。TxAgent利用多步骤推理提供个性化治疗方案。RDAgent自动化数据驱动研发流程，加速创新研究。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31