阿里Qwen3-Coder携1M上下文杀来！5分钟生成网站，开发者狂欢：Claude Code可以卸载了

整理 | 褚杏娟

今天，阿里正式发布了其“迄今为止最具代理能力的代码模型” Qwen3-Coder。

Qwen3-Coder 有多个版本，其中 Qwen3-Coder-480B-A35B-Instruct 是一个有 480B 参数、35B 激活参数的 MoE 模型，原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token，拥有卓越的代码和 Agent 能力。据悉，该模型支持 358 种编程语言，在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果，可以与 Claude Sonnet4 媲美。

与此同时，阿里还推出并开源了一款用于代理式编程的命令行工具：Qwen Code。Qwen Code 是一个 CLI 工具，修改自 Gemini CLI，针对 Qwen3‑Coder 系列的模型增强了解析器和工具支持。据悉，Qwen Code 基于 Gemini Code 进行二次开发，但团队进行了 prompt 和工具调用协议适配，以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。另外，Qwen3-Coder 还可以和社区优秀的编程工具结合，如 Claude Code、Cline 等。

据介绍，借助 Qwen3-Coder，刚入行的程序员一天就能完成资深程序员一周的工作，生成一个品牌官网最快只需 5 分钟。

目前，Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源，全球开发者都可以免费下载使用。截至发稿前，该模型已在 Github 上获得 5.1k stars。此外，Qwen3-Coder 很快将接入阿里的 AI 编程产品通义灵码，API 也已上线阿里云百炼。

相关地址：

https://github.com/QwenLM/Qwen3-Coder

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder 训练过程

预训练

据悉，这次团队从不同角度进行 Scaling，以提升 Qwen3-Coder 的代码能力：

数据扩展：总计 7.5T（代码占比 70%），在保持通用与数学能力的同时，具备卓越的编程能力；
上下文扩展：原生支持 256K 上下文，借助 YaRN 可拓展至 1M，专为仓库级和动态数据（如 Pull Request）优化；
合成数据扩展：利用 Qwen2.5-Coder 对低质数据进行清洗与重写，来显著提升整体数据质量。

后训练

团队在更丰富的真实代码任务上进行了扩展 Code RL 训练。与当前社区普遍聚焦于竞赛类代码生成不同，团队认为所有的代码任务天然适合执行驱动的大规模强化学习。通过自动扩展测试样例，团队构造了大量高质量的训练实例，不仅显著提升了代码执行成功率，还对其他任务带来增益。

在真实世界的 Software Engneering Task，比如 SWE-Bench，模型需要在环境中不断交互，自主规划、选择工具调用、接受反馈不断做出新决策，这是一个典型的 Long-Horizon RL 任务。

团队在 Qwen3-Coder 的后训练阶段执行了 Agent RL，鼓励模型通过多轮交互的方式利用工具解决问题。据介绍，Agent RL 的主要挑战在于 Environment Scaling，团队实现了可验证环境的扩展系统，借助阿里云的基础设施，实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测，最终我们在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。

效果如何？

Qwen3-Coder 是社区期待已久的大模型之一。4 月底时候就有人提出，希望确保 Qwen3coder 使用最新 / 更新的高质量代码进行训练，尤其是针对系统编程语言的代码。还有开发者表示，希望 Qwen3-coder 能在 C 和 C++ 领域有更多涉猎。“现在的 AI 模型都针对 Web 和桌面开发进行了优化。但我们今天使用的很多技术仍然嵌入在智能设备中，而且由于对传统硬件组件的依赖，大多数公司无法切换到 Rust。”

Qwen3-Coder 发布后开发者们表现出了很大的热情。

SnapEdit 联合创始人兼首席执行官 Oscar Le 发推称，“Qwen 从来没有让我失望过。现在大家不用再每月花 200 美元购买 Claude Code 了。”

苹果研究员 Yufan Zhuang 也称赞Qwen 正在推动开源人工智能研究。

Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型。在浏览器调用（WebArena）、工具调用（BFCL）等 Agent 能力评测中，Qwen3-Coder 刷新开源模型纪录，超越 GPT4.1；在考察模型自主规划解决编程任务的 SWE-Bench 评测中，Qwen3-Coder 取得了开源最佳效果，媲美 Claude4。

据介绍，Qwen3-Coder 具备出色的 Agent 能力，尤为擅长解决多步骤的长任务，它能通观全局自主安排工作内容，支持 Agent 调用各种工具深入钻研，最终解决复杂编程任务。官方实测数据显示，在执行任务时，Qwen3-Coder 能够调用的工具数量比 Claude 多几倍，效果非常出色。

Qwen3-Coder 能帮助程序员完成基础的编程任务，比如写代码、补全代码、修 Bug 等，编程工作效率大幅提升，代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。同时，Qwen3-Coder 也极大降低了普通人入门编程的门槛，比如一句话就能生成精妙复杂的 3D 物理模拟过程：

Qwen Chat Web Dev：

用一句名言测试你的 WPM：

旋转超立方体中的弹跳球：

太阳系模拟：

DUET 游戏：

“我测试了该基准测试的几个示例。默认基准测试使用的提示只要求回答问题。这意味着推理模型凭借其较长的 COT（参见 QwQ）具有巨大的优势。但当我更改提示词，要求模型逐步推理并考虑所有细微的上下文时，更新后的 Qwen3 235B 表现明显更好。”有开发者反馈道。

还有做了测试的开发者表示“速度快得离谱”。不过，也有开发者遇到了一些问题：“我尝试让它进行一些基本操作，如用 MCP 工具读取一些文件，但即使我详细解释了如何操作，它还是失败了。”

另外，有开发者找到了阿里云百炼上的价格：

附：在 Claude Code 使用 Qwen3‑Coder 的方法

官方给出了 Qwen3‑Coder 与 Claude Code 搭配使用的具体方法，具体提供了两种接入方式。

方案 1：使用 dashscope 提供的代理 API

只需要将 Anthropic 的 base url 替换成 dashscope 上提供的 endpoint 即可。

export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

至此，可以直接输入 claude 开始使用 Qwen3-Coder & Claude Code

方案 2：使用 claude-code-config 自定义路由

claude-code-router 是一个第三方的路由工具，用于为 Claude Code 灵活地切换不同的后端 API。dashscope 平台提供了一个简单的扩展包 claude-code-config，可为 claude-code-router 生成包含 dashscope 支持的默认配置。

npm install -g @musistudio/claude-code-router
npm install -g @dashscope-js/claude-code-config

生成配置文件和插件目录：

ccr-dashscope

该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最后，通过 ccr 开始使用 Claude Code：

ccr code

（文：AI前线）

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

发表评论 取消回复

发表评论取消回复