o3 & o4-mini 发布:哪些模型该被替代

 

今天凌晨, OpenAI 发了两款模型:

  • • o3:o1 的上位替代。性能上桌、推理准、能用工具,是真正的主力旗舰。
  • • o4-mini:o3-mini 的上位替代,很多场景赢 o3,价格便宜

并且,这俩模型都可以使用工具了

先有个直觉,这里我做了个图:

o1 完成了他的历史使命

划重点:
→ 便宜,并且高性能?用 o4-mini
→ 做复杂系统、多步规划?用 o3
→ 还在用 o3-mini?现在就是换的时候


性能

o4 mini 在简单任务(哪里简单了..)表现很棒

总结几个重点:

  • • 数学:o4-mini > o3 > o3-mini
  • • 代码:o4-mini > o3 > o3-mini
  • • 复杂知识:o3 > o4-mini > o3-mini

多轮指令遵循:o3 >> o4-mini > o3-mini

在复杂任务上,o3 还是很亮眼的

价格

o4-mini 的价格不错

关键点:

  • • o4-mini 完美替代 o3-mini:价格一样,但性能更强
  • • o3 适合复杂推理的任务,别一上来就选它
  • • 还在跑 o1 的,除非你是老系统迁移,不然就是浪费钱

总结

简单来说

o3 是通用旗舰,复杂任务的天花板
o4-mini 是新默认,便宜又快,适合跑量任务

选择指南

o3-mini 的用户:别犹豫,换 o4-mini,现在就行
新项目:用 o4-mini 起步,性价比最高
o1 用户:赶紧迁出,那个模型早该退休了
复杂任务:需要多轮规划的,用 o3 试试

 

(文:赛博禅心)

发表评论