文档处理新革命!Chunkr 专为RAG与知识库场景设计,多格式智能解析!
Chunkr 是一款基于视觉语言模型的文档处理API,能够将PDF、PPTX、DOCX等复杂文档转为RAG/LLM就绪的结构化数据。它解决了OCR识别不准和格式转换耗时等问题,支持多格式文档解析、带边界框的高精度OCR、语义分块等功能,并提供Python SDK和多种输出形式。
Chunkr 是一款基于视觉语言模型的文档处理API,能够将PDF、PPTX、DOCX等复杂文档转为RAG/LLM就绪的结构化数据。它解决了OCR识别不准和格式转换耗时等问题,支持多格式文档解析、带边界框的高精度OCR、语义分块等功能,并提供Python SDK和多种输出形式。
Versatile-OCR-Program是一款教育场景专用的OCR工具,能够提取试卷等复杂材料中的多模态信息,并支持多种语言和输出格式。