我用Qwen3-Coder和Kimi k2打了个PK，它真的更强了！

作者｜子川

来源｜AI先锋官

建议直接把“卷王”的称号直接焊在阿里千问团队的头上！

昨天还在感叹Qwen3-235B-A22B登顶开源模型，没想到今天又放了个大招——Qwen3-Coder！

相关阅读：重磅！阿里Qwen3超越Kimi-K2、DeepSeek-V3登顶，附一手实测

重要的是，效果针不戳，实测下来，速度贼快！

在 Agentic Coding（智能体编程）、Agentic Browser-Use（智能体浏览器使用）和Agentic Tool-Use（智能体工具调用）这些 Agent 评测中。

Qwen3-Coder 刷新了开源模型纪录，甚至超越了 GPT-4.1，直接登顶开源编程模型的宝座。

可以与 Claude Sonnet4 媲美。

Qwen3-Coder包括多个尺寸，其中此次开源的是最强版本Qwen3-Coder-480B-A35B-Instruct。

这是一个450B的MoE模型，其中激活参数为35B，支持 256K 上下文，并且可以通过 YaRN 扩展到 1M 长度。

可能很多朋友不了解YarN，这里给大家简单介绍一下。

YaRN（Yet another RoPE extensioN method）是一种计算高效的上下文窗口扩展方法，用于解决基于Transformer的语言模型（如LLaMA、GPT-NeoX等）在训练后无法泛化到比训练时更长的序列长度的问题。

简单来说：YaRN 的作用就是让 AI 模型在不重新训练整个模型的情况下，直接能处理的文字长度变长，比如把原本只能回答 2 千字的问题，扩展到能回答 2 万字的问题。

好了，废话不多说，此次开源的Qwen3-Coder到底有多强？

老规矩，我们亲手测一测，看看它是不是真的有官方说的那么厉害，这次直接上代码题！

顺便和kimi k2打个PK。

先来一道经典测试题，天气卡片。

提示词：Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions

Qwen3-Coder：

kimi k2:

从呈现出的效果来看，Qwen3-Coder和kimi k2都把天气卡片这个任务跑通了，但Qwen 3的审美明显要比kimi要高出不少。

再来一个，让它们制作一个可以运行的贪吃蛇小游戏。

提示词：你是一位资深游戏开发者，帮我创建一个完整的贪吃蛇游戏。

需要包含以下功能：

蛇的移动和身体增长。随机生成食物。死亡判断（撞墙或撞自己）。显示得分。

Qwen3-Coder：

kimi k2：

为什么kimi k2只放了一个截图出来呢，因为游戏无法动。。。

这局结果很明显，Qwen3-Coder不仅能完整的生成出一个可以动的贪吃蛇游戏，而且它的提示词遵循功能相当不错，所描述的功能都一一实现了。

再来一题。

提示词：写一个漂亮的p5js粒子动画，随鼠标的移动而变化。

Qwen3-Coder：

kimi k2：

结果一目了然，两者都把效果跑出来了，不过kimi k2的更加炫酷。

再来一个难度系数高一点的，喂给它们比亚迪的财务报表，让他们生成可视化网页。

提示词：将这个【比亚迪2025年一季度财报】生成一个Html动态网页，要求：

1.使用Bento Grid风格布局，纯黑色底配合比亚迪红色#e70114作为高亮。

2.提炼文档内容，用超大字体或数字突出核心要点。画面中有超大视觉元素强调重点，与小元素文字形成反差。

3.运用高亮色自身透明度渐变制造科技感，但是不同高亮色不要互相渐变。

4.数据可以引用在线的图表组件，样式需与主题一致。

5.简洁的勾线图形化作为数据可视化或者配图元素。

6.中英文混用，中文大字体粗体，英文小字作为点缀。

7.模仿apple官网的动效，向下滚动鼠标配合动效。

8.使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript。

9.使用专业图标库如Font Awesome或Material Icons (通过CDN引入)。

10.避免使用emoji作为主要图标。

Qwen3-Coder：

kimi k2：

这效果是不是比较酷炫，而且重点都是一次性就生成出来了，完整度很高，如果要说谁生成的更好一些，小编会投给Qwen3-Coder。

原因很简单，视觉冲击感更强，美感更好。

虽然此次测试没有测试一些比较高端的编程玩法（主要是小编一个小卡拉米），但或多或少可以直观的感受到，Qwen3-Coder的编程能力确实强。

目前Qwen3-Coder已经全面上线，大家可以在chat.qwen.ai或在阿里云百炼API使用。

此次除了发表Qwen3-Coder外，阿里还推出并开源了一款用于代理式编程的命令行工具：Qwen Code。

这是一个CLI工具，据介绍，Qwen Code 基于 Gemini Code 进行二次开发，但团队进行了 prompt 和工具调用协议适配以最大激发Qwen3-Coder的能力。

同时，它也支持在Claude Code、Cline等编程工具上使用。

（文：AI先锋官）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

发表评论 取消回复

发表评论取消回复