刚刚！Qwen3推理模型发布，开源界Top1，比肩o4-mini

终于不再是凌晨，我也不用熬夜了。这回，阿里选择下班时间发布新模型，一款基于Qwen3拆出来的纯推理模型。

Qwen3-235B-A22B-Thinking-2507。

参数还是跟之前的Qwen3-235B-A22B一致，总参数235B，激活参数22B，上下文256k，采用极宽松的Apache2.0开源协议，人人均可免费下载商用。

Hugging Face：

https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507

在推理性能和通用能力上有显著提升，效果超过开源界的DeepSeek-R1-0528，比肩闭源界的Gemini-2.5 pro、O4-mini，创下全球开源模型SOTA最佳性能表现。

在编程（LiveCodeBench）、数学（AIME25）等核心能力上，Qwen3推理模型实现了推理性能的再突破。

在知识（SuperGPQA）、创意写作能力（WritingBench）、人类偏好对齐（Arena-Hard v2）、多语言能力（MultilF）等通用能力上，Qwen3推理模型也取得了显著进步。

现在，在Qwen chat、魔搭和Hugging Face上均可体验这一模型。

打开Qwen chat，左上角选择Qwen3-235B-A22B-2507模型，会话框勾选“深度思考”，即可体验。

体验地址：chat.qwen.ai

本周，Qwen三连发。

7月22号，推出Qwen3非思考模型Qwen3-235B-A22B-Instruct-2507，放弃混合架构，在基础通用能力上提升明显，超过Kimi-K2、DeepSeek-V3、Claude-Opus4-Non-thinking等顶级模型。

7月23号，推出代码模型Qwen3-coder，编程能力出色，超过Claude 3.7接近Claude 4的水平。我也第一时间实测了一波，效果非常惊艳。好用是好用，就是大家要注意自己的API费/狗头。

今天（7月25日），推出了Qwen3推理模型Qwen3-235B-A22B-Thinking-2507。

最近这一个月，从MiniMax五连发，到Kimi K2回归，以及Qwen三连击，国产模型真是越来越顶了。

接下来，是不是就等DeepSeek V4&R2了？

在Huggingface（全球权威开源社区）上，热门模型榜已被China模型Qwen、Kimi包圆。

Ps，K2其实已经上线有一段时间了，但依然能稳居前列，Kimi这次是真的好起来了。

在OpenRouter上（海外知名模型API聚合平台），Qwen的API调用量猛增，过去几天已突破了1000亿tokens，在趋势榜上包揽全球前三。

而就在刚才，阶跃星辰发布了新一代基础模型Step3，定位「最强开源多模态推理模型」，将于7月31日正式开源。

WAIC 2025开幕前夕

我刚刚体验了一波，多模态推理属实NB。

体验地址：https://www.stepfun.com

不得不说，中国模型是真的站起来了。无论是性能、生态还是价格，在全球人工智能领域都极具竞争力。

还真应了那句话——“华夏模型多俊秀，敢教日月焕新天。”DeepSeek如是说到。

（文：沃垠AI）