Hugging Face Transformers库归档

本地部署大模型实现扫描版PDF文件OCR 识别，笔记本可跑

2025年5月8日14时作者 Datawhale

通过本地部署Qwen2.5-VL模型实现从PDF文件中提取文字内容并完成OCR任务，最终输出为Markdown文档。项目涉及Transformers、vLLM和具体的大模型如QWen2.5-VL，并使用Hugging Face的Transformers库和modelscope下载模型。