Zotero OCR神器,一键翻译 PDF 论文,轻松提升阅读效率!

 

阅读英文 PDF 论文时,频繁查找专业术语或复杂表达的翻译往往打断思路,严重影响效率。

英文论文的术语密集和复杂句式常让非英语母语者头疼,传统翻译工具难以处理学术内容,且无法保留公式或优化排版。

今天为大家推荐一款专为 Zotero 开源文献管理工具设计的翻译插件:zotero-pdf2zh

它能一键将英文论文翻译为中文,支持中英对照、保留数学公式和图表,甚至将双栏论文转为单栏,优化手机阅读体验。

基于 Python 的 FastAPI 后端和 Zotero 插件架构,提供高质量翻译服务。

zotero-pdf2zh 还支持多种翻译引擎(如 Bing、DeepSeek、智谱)和灵活样式(纯中文、中英对照等),是学术研究者和学生的理想工具。

核心功能

  • • 一键翻译英文PDF论文:支持整篇论文翻译,输出纯中文或中英对照 PDF。
  • • 多翻译引擎支持:集成 Bing、DeepSeek、智谱等,支持自定义 API 接口。
  • • 保留公式图表:使用 pdf2htmlEX 解析 PDF,精准保留 LaTeX 公式、表格和图像。
  • • 双栏转单栏:智能将双栏 PDF 转为单栏,优化手机和平板阅读。
  • • 字体优化:支持设置中文字体(如霞鹜文楷),提升阅读舒适度。

快速使用

PDF2zh 需要部署服务端(FastAPI)和安装 Zotero 插件,支持 Docker 或手动部署。

步骤一:安装PDF2zh

pip install pdf2zh flask pypdf # 安装pdf2zh和需要的包
pip install --upgrade pdf2zh # 更新pdf2zh
pdf2zh --version  # 检验是否正常安装

测试PDF2zh的安装是否成功

pdf2zh document.pdf # document.pdf是待翻译的文件

步骤二:在Zotero中配置插件参数

翻译参数说明:

步骤三:添加配置文件,修改翻译中文字体

① 新建 config.json 文件,将该配置文件的路径输入到第一步的Zotero翻译配置中。

② NOTO_FONT_PATH为自定义字体路径。

如果使用docker方法启动,则需要挂载字体文件: – ./zotero-pdf2zh/LXGWWenKai-Regular.ttf:/app/LXGWWenKai-Regular.ttf

③ translators中配置翻译引擎。

config.json文件示例如下:

{
    "USE_MODELSCOPE""0",
    "PDF2ZH_LANG_FROM""English",
    "PDF2ZH_LANG_TO""Simplified Chinese",
    "NOTO_FONT_PATH""./LXGWWenKai-Regular.ttf",
    "translators": [
        {
            "name""deepseek",
            "envs": {
                "DEEPSEEK_API_KEY""sk-xxxxxxx",
                "DEEPSEEK_MODEL""deepseek-chat"
            }
        },
        {
            "name""zhipu",
            "envs": {
                "ZHIPU_API_KEY""xxxxxx",
                "ZHIPU_MODEL""glm-4-flash"
            }
        },
        {
            "name""openailiked",
            "envs": {
                "OPENAILIKED_BASE_URL""https://ark.cn-beijing.volces.com/api/v3",
                "OPENAILIKED_API_KEY""xxxxx",
                "OPENAILIKED_MODEL""ep-xxxx-xxxxx"
            }
        }
    ]
}

步骤四:脚本执行

方式①:命令行方式启动

# 1. 自动或手动下载脚本文件
wget https://github.com/guaguastandup/zotero-pdf2zh/raw/refs/heads/main/server.py
# 2. 执行脚本文件, 命令行参数8888为端口号,可以自行修改 (需要确保端口是开放的)
python server.py 8888

方法②:Docker方式启动

docker build --build-arg ZOTERO_PDF2ZH_FROM_IMAGE=byaidu/pdf2zh:1.9.6 --build-arg ZOTERO_PDF2ZH_SERVER_FILE_DOWNLOAD_URL=https://github.com/guaguastandup/zotero-pdf2zh/blob/main/server.py -t zotero-pdf2zh .
docker run zotero-pdf2zh

方式③:docker-compose方式启动

docker compose build
docker compose up -d

步骤五:翻译文件

打开Zotero,右键选择条目或者附件。 如果选择条目,将会自动选择该条目下创建时间最早的PDF。

支持翻译PDF、裁剪PDF、双栏对照等选项。

翻译效果截图:

写在最后

Zotero + PDF2zh,真正将“文献管理”提升到“知识管理”的新阶段。

它不仅解决了翻译痛点,还在排版优化、公式兼容、个性配置等方面做到了极致细腻,完全是科研人士的得力助手。

以下优点都值得大家入手尝试一番:

✅ 完全开源,本地部署安全可控
✅ 翻译保留原始论文结构和格式
✅ 智能识别双栏、图表、公式,译文美观又实用
✅ 可嵌入 Zotero 工作流,无需频繁切换工具

GitHub 开源地址:https://github.com/guaguastandup/zotero-pdf2zh

 

● 一款改变你视频下载体验的神器:MediaGo

● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star

● 最新最全 VSCODE 插件推荐(2023版)

● Star 50.3k!超棒的国产远程桌面开源应用火了!

● 超牛的AI物理引擎项目,刚开源不到一天,就飙升到超9K Star!突破物理仿真极限!








(文:开源星探)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往