混合推理模型归档

一个模型超了DeepSeek R1、V3，参数671B，成本不到350万美元

2025年8月2日12时作者机器之心

Deep Cogito发布四款混合推理模型，包括4050亿参数稠密模型和6710亿MoE模型，展示迭代蒸馏与增强技术，训练成本不到350万美元。

最新！Qwen 3 GPQA跑分接近DeepSeek R1：仅用三分之一参数

2025年4月30日11时作者 AI寒武纪

大模型独立分析公司Artificial Analysis对Qwen3进行了最新评估，结果显示其表现优异。特别是235B-A22B版本的Qwen3模型，在开启推理模式下达到了70%的GPQA Diamond得分，接近DeepSeek R1和Gemini 2.5 Flash的表现，相比阿里此前最好的Qwen1.5-32B模型有显著提升。

谷歌大模型“性价比之王”来了！混合推理模型，思考深度可自由控制，竞技场排名仅次于自家Pro

2025年4月18日11时作者量子位

谷歌新推出Gemini 2.5 Flash预览版，性价比高且支持自由调控思考深度。在大模型竞技场中排名第二，并在编程和数据分析能力上超过o4-mini。

Claude 3.7 Sonnet超全使用指南：8种方法，白嫖到付费全都有！

2025年3月1日14时作者 AI信息Gap

推荐使用Claude 3.7 Sonnet模型的8种方法，包括Claude.ai、Anthropic API等。Claude 3.7 Sonnet是全球首个混合推理模型，优势在于支持精细调整思考时长和成本性价比高；此外还有Poe、Perplexity、Genspark、GitHub Copilot、Cursor、Trae等多种使用方式推荐。

Anthropic 推全球首个混合推理模型Claude 3.7，编程能力大幅增强

2025年2月25日14时作者 AI先锋官

Anthropic发布了新款Claude 3.7和Claude Code，Claude 3.7是首个混合推理模型，可在不同模型间选择答案，并展示思考过程。它在多个基准测试中表现优异，在SWE-bench Verified 和 TAU-bench 中表现出色，在零售和航空场景下的表现也优于其他模型。Anthropic还推出了代理编码工具Claude Code，能帮助用户完成代码任务。

Claude 3.7 Sonnet发布：别提什么AGI，我Anthropic要赚企业客户的钱！

2025年2月25日12时作者硅星人Pro

Anthropic发布了其新模型Claude 3.7 Sonnet，这是一个混合推理模型，具备标准思考和扩展思考模式。它在多个测试中表现出色，并改进了代理训练能力。虽然Claude 3.7 Sonnet在一些指标上不如其他顶级推理模型，但Anthropic强调其在解决GitHub上的实际软件问题方面表现出色，并推出了智能编码工具Claude Code。

首个混合推理模型Claude 3.7发布！编程能力全面领先，还能精准控制思考时间

2025年2月25日8时作者量子位

Claude发布混合推理模型Claude 3.7 Sonnet，提升编码和前端Web开发能力，并推出首个编码工具Claude Code。该模型具备两种思考模式，在标准和扩展思维下都能表现优异，还优化了数学、物理等任务的表现。

2025 年 12 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31