最新!Qwen 3 GPQA跑分接近DeepSeek R1:仅用三分之一参数

大模型独立分析公司Artificial Analysis对Qwen3进行了最新评估,结果显示其表现优异。特别是235B-A22B版本的Qwen3模型,在开启推理模式下达到了70%的GPQA Diamond得分,接近DeepSeek R1和Gemini 2.5 Flash的表现,相比阿里此前最好的Qwen1.5-32B模型有显著提升。

谷歌大神首次揭秘Gemini预训练秘密:52页PPT干货,推理成本成最重要因素

谷歌内部分享揭秘Gemini预训练背后逻辑与挑战,提出优化模型大小、数据量及推理效率的新方法。强调硬件感知优化、蒸馏技术应用以及引入更多维度的低成本研究机遇。