本地部署大模型实现扫描版PDF文件OCR 识别,笔记本可跑
通过本地部署Qwen2.5-VL模型实现从PDF文件中提取文字内容并完成OCR任务,最终输出为Markdown文档。项目涉及Transformers、vLLM和具体的大模型如QWen2.5-VL,并使用Hugging Face的Transformers库和modelscope下载模型。
通过本地部署Qwen2.5-VL模型实现从PDF文件中提取文字内容并完成OCR任务,最终输出为Markdown文档。项目涉及Transformers、vLLM和具体的大模型如QWen2.5-VL,并使用Hugging Face的Transformers库和modelscope下载模型。