OpenAI昨夜动作频频:服务器一度宕机,o3模型价格暴跌80%,o3-pro正式发布,开源模型却意外跳票,Sam Altman还发了篇可能是最后一次纯人工写作的长文。

o3价格跳水,每百万token仅2美元
OpenAI宣布将o3模型的价格下调80%,输入价格从8美元降至2美元每百万token,输出价格从40美元降至8美元。

这个价格调整立即生效,意味着o3的单token价格已经与GPT-4.1持平。不过别高兴太早,由于o3生成的token数量约为GPT-4.1的7倍,实际每次查询的成本还是明显更高。
Artificial Analysis 分析指出:
o3的新定价与Gemini 2.5 Pro相当,在人工智能指数表现上也旗鼓相当。同时,它以更低的单token价格实现了比Claude 4 Sonnet Thinking更高的智能水平。
OpenAI研究员Noam Brown表示,智能成本与智能能力的曲线将持续快速提升。「输入成本现为每100万次调用2美元,输出成本为每100万次调用8美元。成本与智能提升的曲线将继续快速发展。」
开发者Scott Wu的评价更加直接:「新的o3价格比两年前的GPT-4-32k便宜了15倍。与此同时,用例数量可能增长了100万倍。向OpenAI团队致敬!」
知名AI专家Jeremy Howard更新了Aider的评测,指出o3以更低成本和更快速度实现了接近Gemini Pro模型的性能,位列第三。
o3-pro正式登场,但推理太慢了
OpenAI同时发布了o3-pro模型,现已向所有ChatGPT Pro用户和API开放。

在专家评测中,o3-pro在科学、教育、编程、数据分析和写作等关键领域全面超越o3。评审者一致认为o3-pro在清晰度、全面性、遵循指令能力和准确性方面表现更优。
学术评测数据显示,o3-pro确实强悍:
-
AIME数学测试:90%(4/4可靠性测试) -
GPQA博士级科学测试:76% -
Codeforces编码比赛Elo评分:2301

o3-pro还支持20万token上下文,最高输出10万token,适合处理完整项目历史及大型代码库。

沃顿商学院的Ethan Mollick教授分享了一个有趣的测试:o3-pro成功解决了从「SPACE」到「EARTH」的词梯难题,而且生成的路径与互联网上仅有的答案不同,排除了训练数据污染的可能。

Rohan Paul兴奋地表示:「o1与o1 pro版本有显著差距,o3 Pro被认为具有非常卓越的性能表现。」他还分享了详细的性能对比图:

Boris Power指出:「自最初的o1-preview版本以来,推理模型性能的提升呈现令人瞩目的轨迹,60%以上的胜率在模型升级中极为罕见。」
Sam Altman自己也难掩兴奋:「初次看到与o3版本相比的胜率时难以置信其提升幅度。」
Alex Volkov在他的播客中评价:「o3-pro基于人类反馈,表现显著优于o3及其他已有模型。」

但o3-pro有个大问题:太慢了!
开发者Yuchen Jin的测试让人哭笑不得:仅仅一句「Hi」的交互,o3-pro思考了13分28秒,花费高达80美元!
Yuchen Jin无奈地说:「o3-pro是当前推理速度最慢且过度推理的模型。」他甚至向Sam Altman喊话,希望能看到o3-pro的「内在独白」,了解它到底在想什么。
另一位用户Advait抱怨:「o3 pro什么时候能回答我的问题?已经加载45分钟了。」

尽管如此,Yuchen Jin还是承认:「o3-pro继承了o1-pro的稳健性,同时集成了内置搜索功能,表现稳定。」
OpenAI员工Aidan McLaughlin透露,ChatGPT实际使用的是「o3-medium」配置,而非更高级的「o3-high」。这种配置从o1开始就一直在用,可能是出于成本考虑,也可能是为了突出o3-pro的性能跃升。

API定价方面,o3-pro每百万输入token收费20美元,输出80美元,比o1-pro便宜87%。OpenAI建议搭配后台模式使用,适合处理长时任务。

Kevin Weil表示,OpenAI正在为Plus用户翻倍o3的调用速率限制,让用户能更自由地使用这个强大的模型。
开源模型意外延期,是为了狙击DeepSeek?
就在大家期待OpenAI的开源模型时,Sam Altman突然宣布延期:
「我们的开源权重模型需要更多时间,预计夏末发布而非6月。我们的研究团队做了一些意想不到且相当惊人的事情,我们认为等待将非常值得,但需要更长时间。」

网友们的反应各异。
有人直接问「GPT-5在哪?」,有人调侃「你真的说了’我们在烹饪’,然后就关火去过暑假了」。
这个时间点很微妙。
DeepSeek刚刚发布了性能强悍的R1模型,OpenAI选择在此时延期,是为了狙击对手,还是因为自家模型还不如DeepSeek R1?
OIiver的猜测:「延期几乎可以肯定是因为OpenAI在周期很晚的时候决定,将支持scratchpad的思考方案拼接到内存高效的MoE架构上,并配备实时推理检查安全工具。这三个部分单独来看都是开创性的,整合在一起需要重新训练、新的评估和新的红队测试——如果要公开发布权重,这些工作不能急于求成。」
Sam Altman的「温和奇点」
在这个特殊的夜晚,Sam Altman发布了一篇题为《温和奇点》的长文,他说这可能是自己最后一次完全不借助AI写作了。

文章的核心观点相当震撼:
「我们已经越过了事件视界;起飞已经开始。人类即将构建数字超级智能,至少到目前为止,它远没有看起来那么奇怪。」
时间线预测:
-
2025年:能够完成真正认知工作的智能体已经到来,编写计算机代码将永远不同 -
2026年:可能出现能够发现新见解的系统 -
2027年:可能出现能够在现实世界中执行任务的机器人
关于智能成本: 「在2030年代,智能和能源——想法,以及实现想法的能力——将变得极其丰富。这两者长期以来一直是人类进步的根本限制因素;有了丰富的智能和能源(以及良好的治理),理论上我们可以拥有其他一切。」
关于奇点的本质: 「从相对论的角度来看,奇点是一点一点发生的,融合是缓慢进行的。我们正在攀登指数技术进步的长弧;向前看总是垂直的,向后看总是平坦的,但它是一条平滑的曲线。」
「这就是奇点的运作方式:奇迹变成例行公事,然后成为赌注。」
关于ChatGPT查询的能耗: 「人们经常好奇ChatGPT查询使用多少能源;平均查询使用约0.34瓦时,大约是烤箱一秒钟多一点的用电量,或高效灯泡几分钟的用电量。它还使用约0.000085加仑的水;大约是一茶匙的十五分之一。」
关于工作的未来: 「一千年前的自给农民看到我们今天的工作会说我们有假工作,认为我们只是在玩游戏来娱乐自己,因为我们有充足的食物和难以想象的奢侈品。我希望我们看一千年后的工作时会认为它们是非常假的工作,我毫不怀疑对于从事这些工作的人来说,它们会感觉非常重要和令人满意。」
关于AI安全和分配的两步走战略:
-
解决对齐问题:确保AI系统能够学习并朝着我们集体真正想要的长期目标行动(社交媒体推送算法是错位AI的例子;那些算法在让你继续滚动方面非常出色,清楚地理解你的短期偏好,但它们通过利用你大脑中的某些东西来做到这一点,这些东西会覆盖你的长期偏好)
-
让超级智能变得便宜、广泛可用:不要过度集中在任何个人、公司或国家。社会是有韧性的、有创造力的,适应迅速。如果我们能够利用人们的集体意志和智慧,那么虽然我们会犯很多错误,有些事情会出现严重问题,但我们会快速学习和适应
最后的愿景: 「智能太便宜而无法计量已经触手可及。这听起来可能很疯狂,但如果我们在2020年告诉你今天会达到什么程度,那可能听起来比我们对2030年的当前预测更疯狂。」
「愿我们平稳、指数级且平静地扩展到超级智能。」
网友们对这篇文章的反应相当激烈:
有人认为这是重大信号:「Sam说这是他最后一次纯人工写作,这意味着什么?AGI真的要来了?」
有人关注实际影响:「如果2027年机器人真的能在现实世界执行任务,那制造业、服务业都要天翻地覆了。」
也有人保持怀疑:「每年都说AGI要来了,结果呢?我看这就是在给投资人画饼。」
还有人关注伦理问题:「Sam提到的对齐问题确实很关键,社交媒体算法已经是个教训了,超级智能如果错位,后果不堪设想。」
一位开发者评论道:「有意思的是他提到科学家现在的生产力是之前的2-3倍,如果AI能让我们在一年内完成十年的研究,那确实是指数级的变化。」
另一位网友则关注能源问题:「ChatGPT一次查询只用0.34瓦时,比我想象的少多了。但如果真的智能无处不在,总能耗还是个大问题。」
或许,我们真的站在了一个时代的转折点上。
相关链接
OpenAI官方链接:
-
OpenAI官方模型发布说明:https://help.openai.com/en/articles/9624314-model-release-notes -
o3模型文档:https://platform.openai.com/docs/models/o3 -
o3-pro模型文档:https://platform.openai.com/docs/models/o3-pro -
后台模式指南:https://platform.openai.com/docs/guides/background
Sam Altman的「温和奇点」长文:
-
原文链接:https://blog.samaltman.com/the-gentle-singularity
第三方分析链接:
-
Artificial Analysis模型对比:https://artificialanalysis.ai/models -
Artificial Analysis趋势分析:https://artificialanalysis.ai/trends#efficiency
相关推文链接:
-
OpenAI官方推文(o3-pro发布):https://twitter.com/OpenAI/status/1932530423911096508 -
OpenAI开发者推文(价格调整):https://twitter.com/OpenAIDevs/status/1932532781457752533
(文:AGI Hunt)