作者|子川
来源|AI先锋官
建议直接把“卷王”的称号直接焊在阿里千问团队的头上!
昨天还在感叹Qwen3-235B-A22B登顶开源模型,没想到今天又放了个大招——Qwen3-Coder!
相关阅读:重磅!阿里Qwen3超越Kimi-K2、DeepSeek-V3登顶,附一手实测
重要的是,效果针不戳,实测下来,速度贼快!
在 Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)这些 Agent 评测中。
Qwen3-Coder 刷新了开源模型纪录,甚至超越了 GPT-4.1,直接登顶开源编程模型的宝座。
可以与 Claude Sonnet4 媲美。

Qwen3-Coder包括多个尺寸,其中此次开源的是最强版本Qwen3-Coder-480B-A35B-Instruct。
这是一个450B的MoE模型,其中激活参数为35B,支持 256K 上下文,并且可以通过 YaRN 扩展到 1M 长度。
可能很多朋友不了解YarN,这里给大家简单介绍一下。
YaRN(Yet another RoPE extensioN method)是一种计算高效的上下文窗口扩展方法,用于解决基于Transformer的语言模型(如LLaMA、GPT-NeoX等)在训练后无法泛化到比训练时更长的序列长度的问题 。
简单来说:YaRN 的作用就是让 AI 模型在不重新训练整个模型的情况下,直接能处理的文字长度变长,比如把原本只能回答 2 千字的问题,扩展到能回答 2 万字的问题。
好了,废话不多说,此次开源的Qwen3-Coder到底有多强?
老规矩,我们亲手测一测,看看它是不是真的有官方说的那么厉害,这次直接上代码题!
顺便和kimi k2打个PK。
先来一道经典测试题,天气卡片。
提示词:Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions
Qwen3-Coder:
从呈现出的效果来看,Qwen3-Coder和kimi k2都把天气卡片这个任务跑通了,但Qwen 3的审美明显要比kimi要高出不少。
再来一个,让它们制作一个可以运行的贪吃蛇小游戏。
提示词:你是一位资深游戏开发者,帮我创建一个完整的贪吃蛇游戏。
需要包含以下功能:
蛇的移动和身体增长。随机生成食物。 死亡判断(撞墙或撞自己)。 显示得分。
Qwen3-Coder:
kimi k2:

为什么kimi k2只放了一个截图出来呢,因为游戏无法动。。。
这局结果很明显,Qwen3-Coder不仅能完整的生成出一个可以动的贪吃蛇游戏,而且它的提示词遵循功能相当不错,所描述的功能都一一实现了。
再来一题。
提示词:写一个漂亮的p5js粒子动画,随鼠标的移动而变化。
Qwen3-Coder:
kimi k2:
结果一目了然,两者都把效果跑出来了,不过kimi k2的更加炫酷。
再来一个难度系数高一点的,喂给它们比亚迪的财务报表,让他们生成可视化网页。
提示词:将这个【比亚迪2025年一季度财报】生成一个Html动态网页,要求:
1.使用Bento Grid风格布局,纯黑色底配合比亚迪红色#e70114作为高亮。
2.提炼文档内容,用超大字体或数字突出核心要点。画面中有超大视觉元素强调重点,与小元素文字形成反差。
3.运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变。
4.数据可以引用在线的图表组件,样式需与主题一致。
5.简洁的勾线图形化作为数据可视化或者配图元素。
6.中英文混用,中文大字体粗体,英文小字作为点缀。
7.模仿apple官网的动效,向下滚动鼠标配合动效。
8.使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript。
9.使用专业图标库如Font Awesome或Material Icons (通过CDN引入)。
10.避免使用emoji作为主要图标。
Qwen3-Coder:
这效果是不是比较酷炫,而且重点都是一次性就生成出来了,完整度很高,如果要说谁生成的更好一些,小编会投给Qwen3-Coder。
原因很简单,视觉冲击感更强,美感更好。
虽然此次测试没有测试一些比较高端的编程玩法(主要是小编一个小卡拉米),但或多或少可以直观的感受到,Qwen3-Coder的编程能力确实强。
目前Qwen3-Coder已经全面上线,大家可以在chat.qwen.ai或在阿里云百炼API使用。
此次除了发表Qwen3-Coder外,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。
这是一个CLI工具,据介绍,Qwen Code 基于 Gemini Code 进行二次开发,但团队进行了 prompt 和工具调用协议适配以最大激发Qwen3-Coder的能力。
同时,它也支持在Claude Code、Cline等编程工具上使用。
(文:AI先锋官)