开源文档处理API Chunkr 归档

文档处理新革命！Chunkr 专为RAG与知识库场景设计，多格式智能解析！

2025年8月6日8时作者开源星探

Chunkr 是一款基于视觉语言模型的文档处理API，能够将PDF、PPTX、DOCX等复杂文档转为RAG/LLM就绪的结构化数据。它解决了OCR识别不准和格式转换耗时等问题，支持多格式文档解析、带边界框的高精度OCR、语义分块等功能，并提供Python SDK和多种输出形式。