GPT-5马上推出!OpenAI播客放猛料:透露AI硬件,5年后ChatGPT消失?

OpenAI CEO阿尔特曼40分钟深聊:GPT-5将至,AGI未定,AI硬件与5000亿算力项目揭秘。
编译 |  李水青
编辑 |  心缘
智东西6月19日报道,今天,OpenAI发布了其首期官方播客——联合创始人兼CEO萨姆・阿尔特曼(Sam Altman)最新的40分钟深度访谈。
在访谈中,阿尔特曼谈及了AGI、GPT-5、AI新硬件、隐私、未来规划等多个热点话题,主要信息干货如下:
1、GPT-5大概在今年夏天推出。但命名为GPT-5还是继续迭代GPT-4,OpenAI内部还未确定。阿尔特曼希望以后不必对模型进行复杂的型号命名。
2、ChatGPT在5年后可能不是最受欢迎产品。5年后ChatGPT可能变为完全不同的产品,甚至不再以ChatGPT命名。
3、不清楚是否接近AGI,但每一年都会有人声称我们接近AGI了。真正的突破可能在于能推动科学发现的“超级智能(Super Intelligence)”。
4、谈及与乔纳森·伊夫(Jony Ive)的合作,阿尔特曼还没有用上联合开发的AI新硬件,可能不会很快到来。因为当前的计算机、软件和硬件都是为没有AI的世界设计的,他们需要更“疯狂”的创新。
5、计划投资5000亿美元的星际之门(Stargate)算力项目资金没有完全到位,但会在未来几年里逐步推进。
6、OpenAI不会修改大模型输出内容以植入广告,但可能就内容原生提及的产品及购买引流,进行收费。
7、信息流算法推荐是社交媒体时代的重大错误,AI时代需要规避,在满足用户短期需求和长期需求之间取得平衡。
8、作为新手奶爸,阿尔特曼会用ChatGPT搜育儿知识,未来也担心孩子沉溺于AI,但总体持乐观态度。
9、给25岁年轻人的建议:学用AI工具,更具有韧性、适应性、创造力
▲萨姆・阿尔特曼访谈视频
作为OpenAI官方播客的第一期,本次访谈由前OpenAI应用团队工程师安德鲁·缅因(Andrew Mayne)担任主持人,已上线苹果播客、Spotify等平台。
以下是萨姆・阿尔特曼访谈全程内容的编译,智东西做了不改变原意的编辑。

01.
新手奶爸谈AI育儿:
用ChatGPT搜百科,也担心孩子沉溺


主持人:作为一位新手爸爸,ChatGPT对你有多少帮助?
阿尔特曼:帮了不少。虽然在没有ChatGPT时人们也能很好地照顾孩子,但在最初有孩子的几周里我不知道该怎么做,我不断地问ChatGPT关于孩子发展阶段的问题,我花了很多时间思考我的孩子将来如何使用AI。
主持人:我身边有不少有孩子的朋友,会谈论“这个AI怎么样”这类话题,态度都是开放和乐观的。
阿尔特曼:我认为这是一个好迹象。我的孩子永远不会比AI更聪明,但他们也会成长,能够做一些我们无法想象的事情。他们会非常擅长使用AI,我经常思考这个问题,但我更多思考的是他们将拥有什么,而不是我们没有拥有的东西。我不认为我的孩子们会因为他们不比AI更聪明而受到困扰。
主持人:社交媒体上有人说他厌倦了和他的孩子谈论托马斯小火车,所以他把它放在ChatGPT,设置调到语音模式,能玩一个小时。
阿尔特曼:孩子们很喜欢ChatGPT语音模式,但恐怕这并不全是好事。人们会遇到问题或产生有问题的模拟社会关系。那么社会将不得不想出新的规范,但好处将是巨大的。我们社会总体上擅长探索如何弱化缺点。
主持人:是的,我也持乐观态度。我们看到一些有趣的数据,老师在教室里引导学生使用ChatGPT效果很好,但学生单独使用就让家庭作业很难办,就像孩子们用谷歌搜索搜答案一样。
阿尔特曼:我是那些每个人都担心的孩子之一。让谷歌搜索出来时我就用它搜答案,然后就不学了。你知道(ChatGPT)结果得到较快,学校的孩子们已经适应了。所以我想我们会解决这个问题的。

02.
5年后ChatGPT可能不再主流
不清楚是否已接近AGI


主持人:ChatGPT会是OpenAI五年后最受欢迎的产品吗?
阿尔特曼:五年后ChatGPT会变成一个完全不同的东西。所以某种意义上不会是,但它还会被称为ChatGPT吗?可能不会了。
主持人:所以我们听到的另一个东西是AGI,想听听你对AGI的定义。
阿尔特曼:如果你让我或其他任何人在5年前基于软件的认知的能力提出一个AGI的定义,我认为许多人会给出的定义现在已经被超越了。它会越来越聪明。每年都会有人认为我们已经达成了AGI,但定义会继续扩展并变得更雄心勃勃,仍有很多人同意我们都接近了。但我们现有系统真正提高了人们的生产力,能够做有价值的经济工作。也许更好的问题是,我称之为超级智能(Super Intelligence)的东西需要什么?如果我们有一个能够自主发现新科学或大大提高人们使用该工具发现新科学的能力的系统,对我来说这几乎是一种重新定义的超级智能,对世界来说是一件美妙的事情。
主持人:你是否看到过类似的迹象,让你觉得我们可能已经接近了?
阿尔特曼:没有完全弄清楚,但我对探索的方向越来越有信心。比如,人们使用AI系统编写代码,让研究人员更有效率,它显然没有做新的科学,但这肯定使科学家能够更快地完成研究工作。我们也经常从科学家那里听到o3的声音,所以我不会说我们实现了超级智能,但我们正指导AI去帮助研发人员在得到很好的假说,而且进展速度惊人。从o1到o3,每隔几周团队就会说,我们有一个重要的新想法。当你热衷于发现一个新的重大洞见时,事情会以惊人的速度发展。
主持人:我注意到最近OpenAI刚刚将Operator中的模型切换到o3,改进很大。我觉得之前遇到的问题还是稳定性不够,很多Agent系统遇到无法解决的问题时就会崩溃。
阿尔特曼:有趣的是,谈到AGI问题,很多人告诉我,他们的个人时刻是o3的Operator,就像看AI在流畅使用电脑一样,虽然不是完美的。o3是向前迈出的一大步,但它对我的影响好像没有达到(AGI)那么大。
主持人:Deep Research像是一个很接近AGI的应用场景,当我对一个问题感兴趣时,它会帮我搜索、梳理和总结,比我自己做得更好。
阿尔特曼:我最近遇到一个家伙,他疯狂痴迷于自学,他使用Deep Research来生成他好奇的话题的报告,然后只是整天坐在那里,已经很擅长快速消化它们,知道接下来要问什么。对于那些真的有疯狂学习欲望的人来说,Deep Research像是一个了不起的新工具。

03.
GPT-5今夏推出
模型型号太多阿尔特曼也烦


主持人:GPT-5的时间计划是什么样的?
阿尔特曼:大概在今年夏天的某个时候吧。我们还在来回讨论,是应该迭代GPT-5,还是就像GPT-4o一样继续迭代GPT-4。
主持人:当GPT-4出来的时候,我必须在它与GPT-3.5之间做比较,GPT-3.5也在迭代。那么GPT-5会不会只是GPT-4的一个更好的版本?
阿尔特曼:可能不一定。它可能会向两种方向发展,我们可以继续像GPT-4.5这样迭代,或者在某个时候称之为GPT-5。它曾经更加清晰,我们会训练一个模型并将其推出,然后创建一个新的大模型再推出。但现在系统变得更加复杂,我们可以不断地对它们进行训练,使它们变得更好。我们现在正在考虑这个问题,没有这个答案。但是我认为会有比GPT-4更好的方法。
主持人:是的,这是一个挑战,即使你很懂技术也不一定清楚这些版本的区别,比如,该用o4-mini还是o3?
阿尔特曼:我认为这是范式转变的产物。我们在同时进行这两件事情,已经接近了当前问题的尾声。但我可以想象一个世界,我不知道它是什么,在那里我们发现了一些新的范式,这意味着模型树需要长出新的分叉。
主持人:更复杂的命名?
阿尔特曼:希望我们不必这样做。我很希望看到GPT-5和GPT-6,这对人们来说会更容易使用,不用再思考是用o4-mini(高版本)还是o3或GPT-4。
主持人:o4-mini(高版本)是我用来编程的,o3则拿来进行聊天对话。(阿尔特曼:我想我们很快就会走出这个困境。)当你懂它们时,拥有选择是很有趣的。但我认为使模型更强的一大因素是记忆功能等集成,记忆一开始很简单,现在变得更加复杂了。
阿尔特曼:记忆功能可能是我最近最喜欢的ChatGPT功能。第一次与GPT-3交谈非常震撼,现在计算机能知道很多上下文。如果我用很少的词语问它一个问题,它会基于对我过往生活的了解,非常自信地知道我想让它做什么。有些人不喜欢它,但大多数人真的喜欢。我认为我们正在走向一个世界,如果你愿意,AI将会在充分掌握你的生活背景,并给你超级有用的答案。

04.
不会硬改模型输出内容做广告
但可能收取引流费


主持人:对我来说很酷,但关闭(记忆功能)也是一个很大的挑战。其中一个挑战是《纽约时报》正在与OpenAI进行的诉讼,他们刚刚要求法OpenAI必须保留消费者ChatGPT用户记录超常规的30天的期限。你能解释一下OpenAI的立场吗?
阿尔特曼:显然,我们要与之斗争,我们会赢。我认为《纽约时报》要求这样做太疯狂了。我希望这是一个社会意识到隐私保护非常重要的时刻。隐私需要成为使用AI的核心原则。《纽约时报》这样的媒体要求AI提供商损害用户隐私很不应该,但我希望这能加速社会关于隐私和AI的对话。我们非常认真地对待它。人们现在正在与ChatGPT进行相当私密的对话,ChatGPT将是一个非常敏感的信息来源,我认为我们需要一个能反映这一点的框架。
主持人:这引发了另一个问题,有人会问,OpenAI现在可以访问这些数据,一个是拿数据做训练,OpenAI已经非常明确了何时能训何时不能训,用户可以选择关闭它;另一个是广告这类东西。OpenAI如何应对?你们将如何承担这个责任?
阿尔特曼:我们还没有做过任何广告产品。我并不完全反对它,我可能会选择我喜欢广告的领域,我认为Instagram上的广告就很酷,我从他们那里买了很多东西。但我认为这很难,要做到这一点需要非常小心,人们对ChatGPT有非常高的信任度。
但我认为其中一部分原因是,如果你把我们比作社交媒体或网络搜索,你就正在被货币化,而公司正试图为你提供优质的产品和服务,有的会像让你点击广告或其他什么的,比如算法推荐的内容而非同质化信息。我认为那里有一种心理上的东西?因此如果我们开始修改大模型输出的内容以为广告主植入广告,那将会感觉非常糟糕,破坏信任。但如果用户点击生成内容里原生存在的产品,我们再从中获得一点点交易收入,这对每个人来说都是可接受的事情。也许在交易流之外会有类似的广告,但我们一定会保证它没有干扰大模型内容输出。
主持人:是的,这将是一个困难的问题。我很想通过ChatGPT在家购物,帮我做出明智的购物引导。
阿尔特曼:确实很难。不过,如果我们能以某种非常清晰和一致的方式做到这一点,那也很好。建立良好的服务,人们为此向我们支付费用,很清楚。
主持人:新的Gemini 2.5是一个非常好的模型,但谷歌是一家广告技术公司,我确实会想如果我在使用他们的聊天机器人,是否也会看到很多广告。
阿尔特曼:谷歌搜索长期以来一直是一个了不起的产品。我确实觉得它退化了,之前出现了很多广告,但我仍然认为这是互联网上最好的东西。我喜欢谷歌搜索,所以我不喜欢成为一家优秀的广告驱动公司。

05.
信息流算法推荐是重大错误
AI时代要规避


主持人:说到用户体验,随着人们越来越多地使用ChatGPT等系统,你如何看待未来AI与人的互动形态,比如对AI具有人格这一个观点持什么态度?
阿尔特曼:社交媒体时代的一个重大错误是Feed(信息流)算法。它对整个社会甚至个人用户都产生了一系列意想不到的负面影响,尽管他们正在做用户想要或目前认为用户想要的事情,但这让他们喜欢在网上花费时间,这就是社交媒体的巨大错位。我认为还有很多其他的事情让人们心烦意乱,陷入困境,而不仅仅是快乐和满足。
我一直都知道,AI世界会有新的问题出现。这个世界会有一些不明显的错位,但我们最先遇到的一个问题肯定是,用户希望提问后得到令他愉悦的答复。然后你尝试建立一个对用户最有帮助的模型,并向用户展示两个回复,哪一个对你更有帮助?对于任何给定的事物,您可能希望建模以单向行为。但是在整个过程中,你所使用的AI可能不匹配。我们确实看到了这些问题,如果你过于关注用户信号以及我们在事后讨论的许多其他事情,但我认为这只是一个短期内有趣的问题。在短时间内对用户有帮助,但在很长一段时间内不会有帮助。
主持人:为什么我认为那个标志是DALL·E 3?我认为从技术上讲DALL·E 3是一个非常有能力的模型,但它生成的图像风格都有点趋同了。是不是用户偏好反馈造成的?
阿尔特曼:我不记得DALL·E 3的情况了,但我想是这样的。

06.
星际之门算力工程5000亿投资还没到位
但会逐步推进


主持人:现在每一家都面临算力问题。为了解决这个问题,我们听说了“星际之门(Stargate)”项目,名字非常酷,据称投资了5000亿美元,请你介绍一下情况?
阿尔特曼:关于星际之门?这很简单。这是一个为前所未有的计算量提供资金和搭建能力的项目。人们完全没有足够的计算能力来做想做的事情,但如果人们知道我们可以用更多的计算做什么,他们会想要更多算力。因此,在我们今天能够为世界提供的能力与我们能够为世界提供10倍以上的计算能力之间,存在着巨大差距。或者有朝一日,我希望能够提供100倍以上的计算能力。而与我从事过的其他技术不同的是,至少在AI方面,向全球数亿人提供有用服务的规模是基础设施投资的规模。因此,“星际之门”是一项努力,旨在将大量资本、技术和运营专业知识结合起来,建立基础设施,向所有需要的人提供下一代服务,并使信息尽可能丰富和廉价。
主持人:所以这是一个巨大的全球项目,你也在各地政府寻求合作。有人在社交媒体上问,5000亿美元,你们有钱吗?
阿尔特曼:我们实际上还没有,钱还在银行账户里,但我们将在未来多年里逐步投入。除非真的出了问题,比如客观上我们无法制造这些计算机,我相信人们是看好这个项目的。
主持人:最近我去阿比林参观了建立的第一个据点,这大约占星际门承诺投资5000亿美元的10%,约5000亿美元。我亲眼看到成千上万的人在施工以及GPU机架在建设,还是很震撼的。
阿尔特曼:站在第一个星际之门据点里,我真的只是在思考让GPU运行需要多么复杂的全球系统啊。当你拿出手机在ChatGPT中输入一些内容并得到答案时,你你可能甚至不认为这是特别令人惊讶的事了。
主持人:我读了关于星际之门项目和国际伙伴关系发展的幕后故事,特别是关于阿联酋的合作和马斯克试图的破坏,你看到了什么?听说过什么?有什么看法?
阿尔特曼:我曾在对外说过,我认为马斯克不会滥用他在政府中的权力来进行不公平的竞争。但很遗憾地说我错了。总的来说,我不喜欢犯错,但我认为他做这些事对国家来说真的很不幸。我真的不认为他会这样做。我很感激政府真的做了正确的事情,抵制这种行为。
主持人:我认为改变的事情是,格雷格·布罗克曼(Greg Brockman)刚刚谈到这个,几年前人们认为谁先到谁就是赢家,游戏就结束了。现在我们意识到在其他地方也有很棒的AI实验室,比如Anthropic正在构建很棒的工具,谷歌也有了新的发展。
阿尔特曼:是的。AI的探索在许多方面接近晶体管的发现:许多公司会以此为基础打造伟大的产品,最终它会渗透到几乎所有的产品中,但你不会一直考虑使用晶体管。所以我认为很多公司会在科学发现之上打造成功的业务,我希望埃隆(马斯克)能少一点零和思维。
主持人:我刚刚参加了一个能源会议,让我想到了能源需求。拿Grok 3来说,我猜他们必须在停车场放置发电机才能训练该模型。这就是问题,能源将从哪里来?
阿尔特曼:我觉得到处都是,对吧?我认为现在是一个很大的组合。最终,我认为很多人都对先进的核能感到非常兴奋,包括核裂变和核聚变。但现在我认为这是整体投资组合,天然气、太阳能应有尽有。
传统上,很难在世界各地转移能源。但是如果你用能量交换智力,然后将智力在世界各地移动,那就容易多了。所以你可以在很多地方放置一个巨大的训练中心甚至是大型的推理集群,然后就像在互联网上传输输出一样。

07.

下一代模型要能理解物理化学
能做研究

主持人:我参加了一个活动,有人谈到使用詹姆斯·韦伯太空望远镜最大的瓶颈,是他们即将获得TB级的数据,但没有足够的人员来浏览数据。在这里我们有关于宇宙的答案,但面临大数据的问题。
阿尔特曼:是的,我一直开玩笑说,当我们有足够的钱时,我们应该做的一件事是建造一个巨大的粒子加速器,彻底解决高能物理学。我认为这是一件宏伟壮观的事情。但我想知道,一个真正聪明的AI能够在没有更多数据,没有更大的粒子加速器的情况下查看我们目前拥有的数据并找出答案的可能性有多大?这不是不可能的。
主持人:在1990年代初,有人发现了一种类似Ozempic的药物,但将其给制药公司时被拒绝了。这种药很多年后证明能够缓解慢性肥胖。
阿尔特曼:我猜想还有很多其他的例子。我们可能已经有现有的药物,我们知道它们有用,但改变下它们的使用方式,或者经过几个小的修改,它们就非常接近伟大的事物。听到科学家们使用当前这一代模型进行这种工作很令人振奋。
主持人:所以这听起来像是我们需要的东西之一,对于下一代模型,作为理解物理和化学等知识的模型,Sora在这方面是一个尝试吗?
阿尔特曼:Sora可以理解牛顿物理学,但我不知道它是否能帮助我们发现新的化学要素和新的东西。但我很乐观,用于推理模型的技术将在这些方面对我们有很大帮助。
主持人:推理模型的简短定义是什么,和我问GPT- 4.1问题会有什么区别?
阿尔特曼:GPT模型可以稍微推理一下。事实上,这是让人们感到兴趣的事情之一。在GPT模型的早期阶段,你可以通过告诉模型来获得更好的性能,让我们一步一步地思考。然后它只输出逐步思考的文本,并得到更好的答案,这有点令人惊讶,因为它真的有效。推理模型正在进一步推动这一点。
主持人:所以这个想法就像它能够分解问题,并且可以在每个步骤上花费更多的时间一样。
阿尔特曼:当你问我一个更难的问题,我可能会在脑海中思考并像我内心的独白一样去说,我可以做这个或那个。然后当我思考完后,可以提出一些要点输出答案给你。
主持人:我现在观察到的一个有趣的事情,当我使用App时,当我问一个问题然后将屏幕锁屏后,AI仍在处理和思考它。好像Anthropic忘了拿一个度量标准来衡量思考时间,我认为这其中是有人性的。比如这个模型实际上已经花费了15分钟或30分钟来思考一件事情,这是一个很好的度量标准,但它需要真正给你正确的答案。
阿尔特曼:我感到惊讶的一件事是,人们出人意料地愿意花时间等待一个好的答案。我所有的直觉都是对重要事情的即时反应,用户对于很多事情讨厌等待。但对于难题和一个非常好的答案,人们很愿意等待。

08.
谈与乔纳森合作
AI新硬件还需等待


主持人:OpenAI刚刚宣布正在打造硬件。你们已经和乔纳森·伊夫(Jony Ive)谈论和合作几年了,你现在身上有这个一起研发的新设备吗?
阿尔特曼:还没有,这需要一段时间。我们将尝试做一些像疯狂的高质量水平一样的事情,可能不会很快到来。但是当前的计算机、软件和硬件,都是为没有AI的世界设计的,现在我们处于一个非常不同的世界。而你想要从硬件和软件中得到的东西正在迅速变化。
我们已经探索了一段时间,有几个想法非常令人兴奋。我认为人们需要时间来适应在这种世界中使用计算机意味着什么,因为现在它是如此不同。但如果你喜欢,真的信任一个AI来理解你生活的所有背景和你的问题,并代表你做出正确的判断。你也可以说我们与ChatGPT互动的方式是受到上一代设备的影响。
主持人:手机之所以如此普及的原因之一就是我可以在公共场合看屏幕,我可以私下打电话并与之交谈,我认为新设备面临的挑战之一就是试图弥合我们在公共和私人领域使用的差距。
阿尔特曼:手机是不可思议的东西,从很多角度看它们很棒。你可以想象一种新设备,你可以在任何地方使用,但也有一些我在公开场合做的不同事情,可能你喜欢在家里。我在音乐中建有很棒的立体声系统。当我在世界上行走时,我使用AirPods,这不会打扰我。是的,所以我认为在公共和私人用例中有些事情是不同的,但我同意一般目的很重要。

09.
建议年轻人学用AI工具
更韧性和创造性


主持人:如果你现在正在给一个25岁的人提供建议,你跟他们说了什么?
阿尔特曼:显而易见的建议可能是,比如学习如何使用AI工具。有趣的是,世界发展的有多快,从告诉20-25岁的人“学编程当程序员”到告诉他们“编程不重要,去学习使用AI工具”。我想知道接下来会是什么,但当然它们会成为下一个非常好的战术建议。
然后在更广泛的方面,我相信像韧性、适应性、创造力这样的技能,以及弄清楚其他人想要什么,我认为这些都是可以学习的。这并不像说的那么容易,并不想练习使用ChatGPT一样容易,但这是可行的。而这些技能我认为在接下来的几十年里会有很大的回报。
主持人:你会说同样的话吗,一个45岁的人现在正在学习如何在你的角色中使用它?
阿尔特曼:是的,可能。
主持人:无论您对AGI有什么定义,以后还是会有更多的人为OpenAI工作?
阿尔特曼:是的,我在网上看到很多人说:“他们很优秀,为什么要雇人?”我想,因为电脑不能做所有的事情。展开说就是,会有更多的人,但每个人所做的远远超过一个人在前 AGI时代所做的。这是技术的目标。

09.
结语:阿尔特曼勾勒AGI路线图
GPT-5快来了


在OpenAI首期播客中,阿尔特曼勾勒了OpenAI在通往AGI道路上的关键思考与实践,从今夏即将到来的GPT-5(或迭代版本)、对超级智能的期待,到探索颠覆性的AI硬件、“星际之门”算力计划,OpenAI正积极布局技术前沿,同时审慎思考AI的社会影响与商业模式。
阿尔特曼也谈及了OpenAI及产业面临的挑战,包括如平衡用户隐私与功能需求、规避算法推荐陷阱、防止儿童过度依赖AI等,这些问题都值得产业关注和解决。

(文:智东西)

发表评论