通义千问深夜更新!Qwen3升级版迈向“分离训练”时代,性能全面超越Kimi-K2,Agent能力亮眼

新版本模型Qwen3-235B-A22B-Instruct-2507-FP8在多项核心能力上实现飞跃,超越Kimi-K2等顶级开源和闭源模型。通义千问团队宣布告别混合思维模式,迈向分离训练时代,并留下大招悬念,暗示复杂推理的Thinking模型可能也在路上。

实测通义千问QwQ-Max-Preview:推理能力超 DeepSeek R1、o3mini, 将开源

作者发布了一篇关于QwQ-Max-Preview推理模型的文章,这是继QwQ-32B-Preview之后通义千问团队推出的又一新模型。文章介绍了该模型的基础模型为Qwen2.5-Max,并展示了其在编程、数学等任务中的强大表现。