字节最新开源模型,超越GPT-4、Gemini-2.5与Claude-3.5

最近Kimi k2在huggingface屠榜,以至于很多优秀的模型被忽视了。

今天huggingface排名第15的是字节跳动的Seed X(看起来创作团队是高达爱好者)。

这个模型只有7B,意味着消费级显卡(约14G显存占用)就可以跑起来。

在机器翻译领域,如何在保证高质量的同时兼顾模型规模与推理效率一直是研究与工程应用的两难选择。

近日,字节跳动团队开源了 Seed-X 系列多语言翻译模型(7B),通过精巧的模型结构设计与强化学习微调,实现在仅 7 亿参数规模下,对 28 种语言的翻译性能媲美甚至超越诸如 Gemini-2.5、Claude-3.5、GPT-4 等超大模型。

Seed-X 的开源,不仅为学术研究提供了强有力的基线,也为各行业落地翻译应用带来了轻量、高效的新选择。

介绍

我们很高兴介绍 Seed-X,这是一个强大的开源多语言翻译语言模型系列,包括指令模型、强化学习模型和奖励模型。它在 70 亿参数内推动了翻译能力的边界。我们开发 Seed-X 作为一款易于获取的现成工具,以支持社区在翻译研究和应用方面的发展:

  • 出色的翻译能力:Seed-X 展示了最先进的翻译能力,与或超越了 Gemini-2.5、Claude-3.5 和 GPT-4 等超大型模型,经由人工评估和自动指标验证。
  • 部署和推理友好:Seed-X 具有紧凑的 7B 参数计数和 mistral 架构,提供了轻量高效的翻译性能,在部署和推理方面表现出色。
  • 广泛的领域覆盖:Seed-X 在一个涵盖互联网、科学和技术、办公对话、电子商务、生物医学、金融、法律、文学和娱乐等多个领域的高度挑战性翻译测试集上表现出色。

该仓库包含 Seed-X-PPO 模型,具有以下功能:

  • 因果语言模型
  • 训练阶段: 预训练 & 后训练
  • 支持: 28 种语言的多语言翻译

(我们推荐使用 Seed-X-PPO 模型,因为其翻译性能优于 Seed-X-Instruct。)

语言 缩写 语言 缩写 语言 缩写 语言 缩写
阿拉伯语 阿拉伯语
French
法语 马来语 源代码 俄语
ru
捷克语
cs
克罗地亚语 克罗地亚语 挪威语
nb
瑞典语
sv
丹麦语 丹麦语 匈牙利语
hu
荷兰语
nl
泰语 英语
德语
de
印度尼西亚语
id
挪威语 土耳其语
tr
英语 英语 意大利语 意大利语 波兰语
pl
乌克兰语 英国
西班牙语 西班牙语 日语 日语 葡萄牙语
pt
越南语
vi
芬兰语 芬兰语 韩语 韩语 罗马尼亚语 来源 中文 中文

模型

Model Name
描述 下载
Seed-X-指令 与用户意图对齐的指令调优。 🤗 模型
👉 Seed-X-PPO
使用 RL 提升翻译能力。 🤗 模型
种子-X-RM 评价模型以评估翻译的质量。 🤗 模型

快速入门

📮 通知

  • 提示末尾的语言标签是必要的,这些标签用于 PPO 训练。例如,当目标语言是德语时, 需要添加。您可以参考上面的表格获取语言缩写。
  • 该模型专用于多语言翻译,不预期支持其他任务。
  • 我们没有聊天模板,因此您不需要执行tokenizer.apply_chat_template。请避免以多轮对话格式提示模型。
  • 我们不建议使用非官方的量化版本进行本地部署。 我们很快将发布一个官方的量化模型并在 HF 镜像空间上开发一个演示。

这是一个简单的示例,演示如何加载模型并使用 vllm 进行翻译

推荐: vllm==0.8.0, transformers==4.51.3

from vllm import LLM, SamplingParams, BeamSearchParams

model_path = "./ByteDance-Seed/Seed-X-PPO-7B"

model = LLM(model=model_path,
            max_num_seqs=512,
            tensor_parallel_size=8,
            enable_prefix_caching=True
            gpu_memory_utilization=0.95)

messages = [
# without CoT
"Translate the following English sentence into Chinese:\nMay the force be with you <zh>",
# with CoT
"Translate the following English sentence into Chinese and explain it in detail:\nMay the force be with you <zh>"
]

# Beam search (We recommend using beam search decoding)
decoding_params = BeamSearchParams(beam_width=4,
                                   max_tokens=512)
# Greedy decoding
decoding_params = SamplingParams(temperature=0,
                                 max_tokens=512,
                                 skip_special_tokens=True)

results = model.generate(messages, decoding_params)
responses = [res.outputs[0].text.strip() for res in results]

print(responses)

评估

我们在包括 FLORES-200、WMT-25 以及一个附带了人工评估的公开发布的挑战集中对 Seed-X 进行了评估。

模型主页(免翻墙):

https://hf-mirror.com/ByteDance-Seed/Seed-X-PPO-7B/tree/main 

(文:路过银河AI)

发表评论