文档处理新革命!Chunkr 专为RAG与知识库场景设计,多格式智能解析!
Chunkr 是一款基于视觉语言模型的文档处理API,能够将PDF、PPTX、DOCX等复杂文档转为RAG/LLM就绪的结构化数据。它解决了OCR识别不准和格式转换耗时等问题,支持多格式文档解析、带边界框的高精度OCR、语义分块等功能,并提供Python SDK和多种输出形式。
Chunkr 是一款基于视觉语言模型的文档处理API,能够将PDF、PPTX、DOCX等复杂文档转为RAG/LLM就绪的结构化数据。它解决了OCR识别不准和格式转换耗时等问题,支持多格式文档解析、带边界框的高精度OCR、语义分块等功能,并提供Python SDK和多种输出形式。