



据知情人士透露,OpenAI下一代旗舰模型GPT-5在编程和数学任务方面相较现有模型有所提升,GPT-5生成的代码更注重用户体验和美观性;在支持AI智能体执行复杂任务时也更加高效,所需的人工干预更少。
不过,也有知情人士认为,其进步幅度难以与GPT-3到GPT-4那样的代际飞跃相提并论。
但Orion未能实现预期性能,OpenAI最终于2025年2月将其作为GPT-4.5发布。除了150美元/百万输出tokens的惊人定价,这一模型并未给用户带来深刻的印象。今年7月,OpenAI决定将GPT-4.5的API服务下线,原因是成本过高。这一模型,也成为OpenAI史上最短命的模型之一。
部分失败原因在于预训练阶段的局限性。在这个阶段,模型会处理来自网络和其它来源的数据,从而学习概念之间的关联。研究人员发现,高质量网页数据的供给正在枯竭,而且,他们对小规模模型的调优手段在模型变大后不再奏效。
据参与OpenAI研发的知情人士透露,截至今年6月,OpenAI还没有开发出一款能被称之为“GPT-5”的模型。
OpenAI的另一大挑战,源自于推理模型范式在实际应用中出现的意外情况。
去年秋天,OpenAI推出了第一个推理模型o1,这次发布使OpenAI在AI领域重新获得海量关注,也为后续发展能够处理复杂任务的AI智能体奠定了基础。
到2024年底,OpenAI又基于GPT-4o打造了下一代推理模型o3,与o1属于同一语言模型家族。但知情人士称,o3的“教师模型(teacher model)”在科学和其他专业领域的理解能力,比o1的教师模型有显著的飞跃。
这些提升一部分来自于OpenAI给o3教师模型配置了更多的GPU服务器,从而提供了更强的算力来理解复杂概念;另一部分则源于让模型具备搜索网络和访问代码库的能力。
OpenAI在全球范围内广泛宣传这些推理模型在测试中的强大表现,社交媒体上一片沸腾。但现实很快泼了冷水。
据两位参与开发的人士透露,当OpenAI研究人员将o3的教师模型转化为聊天版本(学生模型),以便ChatGPT用户能与其交互时,其性能大幅下降,与o1相比没有明显进步,最初公布的性能提升几乎消失了,通过API接口供企业使用的版本也存在同样问题。
OpenAI一直在开发被称为“通用验证器”的工具,据知情人士称,这项技术可自动化验证模型在强化学习过程中的回答质量。
通用验证器的核心是让一个模型来检查并评分另一个模型的答案,前者会借助多个来源来查证答案的正确性。
日前,OpenAI资深研究员Alexander Wei在X上发文称,OpenAI在IMO竞赛中取得所谓的“金牌”成绩模型,使用的正是“通用型”的强化学习,这或许意味着,其验证手段可应用于一些没有标准答案、评判标准主观的任务领域。
通用验证器的进展正在帮助OpenAI开发GPT-5,不仅在编程等可验证性强的任务中有所提升,也在创意写作等主观性强的领域展现出进步。
整个行业,包括xAI和谷歌,也都在强化学习上加大投入。负责OpenAI强化学习系统的Tworek公开向外界表态,OpenAI模型背后的强化学习系统实际上就是AGI的核心。
这些新进展也解释了为何OpenAI高管近期在与部分投资人会面时宣称,有信心做到“GPT-8”。
尽管GPT-5距离AGI还有明显差距,但它在编程和推理之外,也具备一些更具吸引力的新特性。据微软内部测试反馈,GPT-5在不显著增加计算资源消耗的前提下,生成的代码和文本质量都有提升。
一位微软员工称,这是因为GPT-5相比以往的模型更擅长判断不同任务所需的算力强度,从而实现更高效的资源分配。
自动化编程已经成为OpenAI重点攻克的方向。部分原因在于竞争对手Anthropic去年在向开发者和工具(如Cursor)提供代码生成模型方面取得了先机。
OpenAI内部也认为,自动化编程不仅对公司未来业务至关重要,更是推动AI研究工作自动化的关键。
Altman此前曾公开表态:凭借现有的技术路径,OpenAI有望实现具有人类智能水平的AI,也就是通用人工智能(AGI)。
不过,在实现AGI的路上,技术并不是唯一的挑战。作为当前最受瞩目的AI创企,OpenAI时时刻刻面临着竞争对手的挖角。
最近,Meta挖走了十多位OpenAI研究员,其中包括参与了OpenAI近期核心技术进展的人员。Meta给这些研究员开出了“顶级球星”水平的薪酬方案,部分人员的甚至拿到了十几亿美元的薪酬包。
这波离职和随之而来的人员重组给OpenAI的高级员工带来了压力。上周,OpenAI研究副总裁Jerry Tworek就在公司内部Slack中向研究负责人Mark Chen表达对团队调整的不满,称自己需要请一周假来重新评估,但最终并未休假。
此外,还有部分高级研究人员抵制将其技术发明交给微软,尽管根据OpenAI与微软的协议,微软可以在2030年之前,使用OpenAI的技术。
OpenAI与其最大外部股东微软之间财务关系紧密,但围绕合作协议条款一直存在摩擦,双方均试图在OpenAI重组营利部门、为未来上市铺路的过程中争取更多让步。
据两位接触过谈判的人士透露,双方的谈判正在朝积极方向推进。一些要点仍在讨论中,但也有内容趋于明朗,例如微软预计将在OpenAI的营利实体中获得约33%的股权。
当GPT-5正式发布时,它将承载外界极高的期望。上周,Altman在一档播客节目中谈及GPT-5的能力时称,他曾提出一个连自己都听不懂的问题,而GPT-5却能轻松作答。
然而,过去一年中,OpenAI在模型性能上的进展放缓,加之宣传与实际能力之间屡次出现明显落差,也引发了外界的质疑:OpenAI能否在AI能力上继续领先谷歌、Anthropic等闭源竞争对手,以及DeepSeek、Qwen、Kimi等头部开源模型?

(文:智东西)