今天凌晨, OpenAI 发了两款模型:
-
• o3:o1 的上位替代。性能上桌、推理准、能用工具,是真正的主力旗舰。 -
• o4-mini:o3-mini 的上位替代,很多场景赢 o3,价格便宜
并且,这俩模型都可以使用工具了
先有个直觉,这里我做了个图:

划重点:
→ 便宜,并且高性能?用 o4-mini
→ 做复杂系统、多步规划?用 o3
→ 还在用 o3-mini?现在就是换的时候
性能

总结几个重点:
-
• 数学:o4-mini > o3 > o3-mini -
• 代码:o4-mini > o3 > o3-mini -
• 复杂知识:o3 > o4-mini > o3-mini
多轮指令遵循:o3 >> o4-mini > o3-mini

价格

关键点:
-
• o4-mini 完美替代 o3-mini:价格一样,但性能更强 -
• o3 适合复杂推理的任务,别一上来就选它 -
• 还在跑 o1 的,除非你是老系统迁移,不然就是浪费钱
总结
简单来说
o3 是通用旗舰,复杂任务的天花板
o4-mini 是新默认,便宜又快,适合跑量任务
选择指南
o3-mini 的用户:别犹豫,换 o4-mini,现在就行
新项目:用 o4-mini 起步,性价比最高
o1 用户:赶紧迁出,那个模型早该退休了
复杂任务:需要多轮规划的,用 o3 试试
(文:赛博禅心)