终于不再是凌晨,我也不用熬夜了。这回,阿里选择下班时间发布新模型,一款基于Qwen3拆出来的纯推理模型。
Qwen3-235B-A22B-Thinking-2507。

参数还是跟之前的Qwen3-235B-A22B一致,总参数235B,激活参数22B,上下文256k,采用极宽松的Apache2.0开源协议,人人均可免费下载商用。
Hugging Face:
https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507
在推理性能和通用能力上有显著提升,效果超过开源界的DeepSeek-R1-0528,比肩闭源界的Gemini-2.5 pro、O4-mini,创下全球开源模型SOTA最佳性能表现。

在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3推理模型实现了推理性能的再突破。
在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3推理模型也取得了显著进步。

现在,在Qwen chat、魔搭和Hugging Face上均可体验这一模型。
打开Qwen chat,左上角选择Qwen3-235B-A22B-2507模型,会话框勾选“深度思考”,即可体验。

体验地址:chat.qwen.ai
本周,Qwen三连发。
7月22号,推出Qwen3非思考模型Qwen3-235B-A22B-Instruct-2507,放弃混合架构,在基础通用能力上提升明显,超过Kimi-K2、DeepSeek-V3、Claude-Opus4-Non-thinking等顶级模型。
7月23号,推出代码模型Qwen3-coder,编程能力出色,超过Claude 3.7接近Claude 4的水平。我也第一时间实测了一波,效果非常惊艳。好用是好用,就是大家要注意自己的API费/狗头。
今天(7月25日),推出了Qwen3推理模型Qwen3-235B-A22B-Thinking-2507。
最近这一个月,从MiniMax五连发,到Kimi K2回归,以及Qwen三连击,国产模型真是越来越顶了。
接下来,是不是就等DeepSeek V4&R2了?
在Huggingface(全球权威开源社区)上,热门模型榜已被China模型Qwen、Kimi包圆。

Ps,K2其实已经上线有一段时间了,但依然能稳居前列,Kimi这次是真的好起来了。
在OpenRouter上(海外知名模型API聚合平台),Qwen的API调用量猛增,过去几天已突破了1000亿tokens,在趋势榜上包揽全球前三。

而就在刚才,阶跃星辰发布了新一代基础模型Step3,定位「最强开源多模态推理模型」,将于7月31日正式开源。

WAIC 2025开幕前夕
我刚刚体验了一波,多模态推理属实NB。

体验地址:https://www.stepfun.com
不得不说,中国模型是真的站起来了。无论是性能、生态还是价格,在全球人工智能领域都极具竞争力。
还真应了那句话——“华夏模型多俊秀,敢教日月焕新天。”DeepSeek如是说到。
(文:沃垠AI)