深度|Sam Altman:创业者不要做OpenAI核心要做的事,还有很多领域值得探索,坚持深耕可长成比OpenAI更大的公司

图片来源:Y Combinator

Z Highlights

  • 如果你要创业,现在是技术史上最好的时机,因为整个世界都在震动。

  • 我们要做的是把伟大的技术建起来,完成科学工作,搭建基础设施,然后让你们去适配真正的需求。

  • 不要去复制我们的核心业务,那里有很多空白地带等待你去探索。

  • 新的设备、新的浏览器、记忆、持久化模型——这些要素组合起来,就能形成非常强大的体验。

Sam Altman是美国著名创业者和投资人,曾任Y Combinator总裁,现任OpenAI CEO。他致力于推动人工智能发展,强调技术与社会责任并重。本次对话为Sam AltmanY Combinator合伙人Garry Tan的对谈。

初心与人才汇聚

Garry TanSam,非常感谢你能来,也谢谢你带来的种种启发。OpenAI本身就是一个激励无数雄心勃勃创业者的存在。我们就从这开始吧:在OpenAI早期,有哪些看起来无足轻重、但后来证明至关重要的决策?

Sam Altman其实,最重要的决策之一就是决定要做这件事本身。我们差点就没创立OpenAI。当时AGI听起来完全是天方夜谭。我那时候还在做Garry现在的工作,有很多别的好项目可以去投——那些靠谱的初创公司,确定能成的生意。相比之下,AGI就像一个遥不可及的幻想。就算它真能实现,DeepMind当时也遥遥领先,几乎无法追赶。2015年那一年,我们断断续续讨论要不要干,但真的就是掷硬币的程度。最后,靠的是一群人,坐在一个屋子里,互相看着对方的眼睛,说:好,就这么干了。这种时刻特别关键——如果犹豫不决,往往就是要冲上去的时候。外界有一千个理由告诉你不该做这件事。

Garry Tan你们当时其实还搞明白了“Scaling Laws”——可现在回头看,很难想象当年AI的氛围是什么样。

Sam Altman明年就是我们十周年了。但要回忆起十年前AI界的氛围……那还是在第一代有效语言模型出现之前的时代。我们那会儿在玩视频游戏,弄了个勉强能转魔方的小机械手。没有任何产品思路,没有营收,更不知道以后能不能有营收。整天围坐在会议桌和白板前,绞尽脑汁想点能写成论文的东西。你现在很难想象,那时候这件事有多不靠谱。ChatGPT在当时听起来,完全就是科幻小说里的东西。

Garry Tan你们围绕AGI这个方向集结了力量,然后找来了在这个领域里最聪明的一群人。

Sam Altman其实第二步没听起来那么难。如果你说:我们要去做一件疯狂的事,但一旦成了意义重大,而且当时还没多少人在做,那你确实能吸引很多优秀的人才。我们说:好,我们就做AGI”99%的人觉得我们疯了。但那1%听懂了这个信号——而那1%里就有很多顶尖人才。我们把这些人集中到一起,这是个有使命感的方向,人们会愿意投身其中。如果你在做的是大家都在做的事,人才很难集中。但如果你在做一个全世界只有你在做的东西,就会有顺风。

Garry Tan那每一个在座的人,应该现在就试着做一家OpenAI级别的公司吗?

Sam AltmanOpenAI在一开始可不是OpenAI级别的公司。那时我们只有八个人,后来变成二十个,连要做什么都很模糊。我们当时只是想写一篇像样的研究论文。任何大的事,一开始都不大。Vinod Khosla有句我特别喜欢的话:零收入的创业公司,和未来能做到千亿美元估值的零收入公司,表面看起来是一样的——都是几个人挤在一个屋子里。所以你只需要选一个方向:一旦做成,它就能变大。之后,就是一步一步、一个蠢操作接着一个蠢操作地往前走,很久很久。

产品与技术的未来

Garry Tan人们使用ChatGPTAPI的方式已经发生了很大变化。像GPT-4o这样的最新模型,有哪些地方让你感到意外?

Sam Altman现在的情况是,模型能力已经很强,但产品形态远远没有跟上,这之间存在巨大的产品滞后。还有太多东西没被构建出来。哪怕模型性能就此停滞(但它不会),光是推理成本也在快速下降。就在上周,GPT-4o的调用成本是现在的5倍,而且还会继续降。我们很快会开源一个模型,我不会抢团队的发布,但可以说,它会超出大家的预期。人们将能在本地运行非常强大的模型,这会让很多人大吃一惊。模型能力已经进入新阶段,成本迅速下探,开源逐渐成型,但我们还没有看到与这些推理能力匹配的产品创新真正到来。

Garry Tan现在的记忆功能,正在把ChatGPT变成一个真正了解你的东西。

Sam Altman记忆功能是我今年最喜欢的一个发布。OpenAI内部可能很多人不这么想,但我真的很喜欢它。它指向我们真正想去的地方:一个了解你、连接你所有内容、并主动帮助你的个人AI。它不会只是等待你来提问,而是始终运行在后台,知道什么时候提醒你,什么时候替你完成任务。它将嵌入你使用的每一项服务中。记忆,就是这个未来的第一道入口。

Garry Tan你当年还发过一些关于Her的推文。能不能内部爆个料,说说它什么时候会真正变成现实?

Sam Altman答案是逐步实现。如果我真有个明确日期,我可能早就兴奋地告诉你了。但其实它已经开始出现了——比如记忆功能;它会进一步演化成始终在后台运行、主动向你推送内容的形态;而当我们推出首款新设备时,它会更加完整。但Her的关键从来不是一个微型硬件,而是那个核心概念:AI长期运行在你身边,并真正像一个伙伴。

Garry Tan我们开始看到LLM正在与真实数据融合。我听说MCP要接入OpenAI了?

Sam Altman是的,应该就是今天上线。人们已经开始把ChatGPT当作他们生活的操作系统了,所以接入尽可能多的数据源非常关键。新的设备、新的浏览器、记忆、持久化模型——这些要素组合起来,就能形成非常强大的体验。

Garry Tan这些会运行在云端、桌面端,还是两者都有?

Sam Altman肯定是混合模式。未来一定会有人在本地运行模型。如果我们能把一半的ChatGPT负载推到用户设备上,对我们来说是再好不过的事。我们即将运营的是全世界最贵的基础设施之一。如果能部分卸载出去,那太棒了。但大量计算还是会继续在云端进行。

Garry Tan现在算力紧张到这个程度,是不是出乎你意料?

Sam Altman我们已经在这方面练得很熟了。但我们是从零开始的——从没有ChatGPT,到2年半内成为全球第五大网站。我们很快可能做到第三,也许哪天能成为第一。这种量级的扩张,不管你怎么做都不容易。

Garry Tan我们看到推理模型和多模态模型正在并行演进。当它们融合后会发生什么?你对GPT-5以及后续模型的愿景是什么?

Sam AltmanGPT-5还达不到最终形态,但我们终极目标是做出一个整合型模型:能进行深入推理、生成实时视频、在需要时深度思考、写代码、为你即时生成应用、渲染交互式视频。这将是一种全新的计算接口形态。

机器人与工业复兴

Garry Tan听起来像是在为具身机器人时代铺路?

Sam Altman完全正确。我们的策略是:先搞定认知,再连接机器人。机器人时代很快就会到来。机械工程曾经是个难点,认知同样如此,但这两件事现在都开始变得可控。几年内,机器人将能胜任很多真正有用的事情。要生产十亿个机器人仍需时间,但想象一下——如果我们能部署一百万个类人机器人,它们可以自动化整个供应链:采矿、运输、制造,甚至制造更多机器人。未来对机器人的需求将远超当前供应链的产能。

Garry Tan你在YC时曾推动硬科技投资。现在地缘局势紧张,我们该如何重建美国的工业能力?

Sam Altman老办法已经被讲了无数遍,但并没有奏效。我们需要尝试一些新的路径。AI和机器人给了我们一个新机会——真的有可能把制造业迁回美国,重新建立起复杂工业体系。这值得一试。

Garry Tan那现在的护城河该怎么建?很多人问:我要怎么创办一家不会被OpenAI碾压的公司?

Sam Altman我们并不想碾压你们。我们在做我们自己的事情——ChatGPT打造成最强的超级助手。我们会为它加上我们认为需要的功能。但这只是AI应用可能性中的很小一部分。我们看到有人只是克隆ChatGPT时,会有点遗憾。我们觉得这一块我们会做得很好,而且起步更早。但其他方向还有很多空白。我们想帮忙,比如为新创公司导流,做一个ChatGPT应用商店,或者提供OpenAI登录按钮,把你的个性化模型带进任何产品。我们的建议是:不要去做我们核心要做的事,还有很多空地。

Garry Tan可现实中,大家还是喜欢卷在热门方向里。

Sam Altman这一直是普遍现象。如果你列出当前最热门的五个AI创业点子,现场恐怕有一半人都会举手说自己正在做其中一个。但将来如果有人能做出比OpenAI还大的公司,我敢打赌,他们绝不会是在做那五个方向中的任何一个。大家扎堆做的事,护城河就更难建立——不是不可能,只是更难。最好的公司往往不是跟风的,这样才能争取时间去打磨产品、找准市场、做出技术突破,之后再考虑护城河。我们一开始也没什么护城河,只有一个唯一真正好用的产品。后来才有了品牌、记忆功能、集成生态。

Garry Tan你在很多根本性问题上都很反主流,比如“Scaling Laws”。现在这些成了共识,但当时并不是。你们面对质疑时,内心是怎样的?是那种管他呢,干就完了的状态吗?

Sam Altman当所有人都说你错时候,要坚持自己的判断其实挺难的。谁说很容易,那一定不是实话。只是时间长了,你会逐渐适应。我印象特别深的一次,后来也公开了:OpenAI成立几年后,Elon给我们发过一封非常严厉的邮件。我们当时还在合作,他在邮件里说我们成功的概率是0,不是很低,而是。我们刚给他展示完GPT-1,他回的是:这玩意没用,不行,毫无意义。那时他是我非常敬佩的人。我那晚回家后心想:如果他说的是对的呢?那我们完了。你把全部精力投入一件事,但你仰慕的聪明人却告诉你这事毫无希望。没什么神奇的解法,就是:被打倒、站起来、拍掉灰尘、继续往前走。

Garry Tan说说AI Agent吧。今年不是被称为“Agent之年嘛,你怎么看OperatorCode Interpreter这些工具?它们将带来哪些我们还没准备好的工作流变化?

Sam Altman过去ChatGPT的角色像Google——你问问题,它给出相当于你搜半小时才能得出的答案。现在你可以给它一个任务,比如用Code Interpreter去深度调研,它会自己工作一阵子,然后带着一个方案回来。这就像是一个非常初级的实习生,帮你干完一小段任务。而现实世界中,有太多工作其实就是坐在电脑前干几个小时的活——这正是Agent擅长的。当下的GPT-4o已经能支持一些这样的体验,而下一代的能力将会让这变得真正可用、可部署。

界面革命与创业黄金时代

Garry Tan你如何看待人机交互的未来?有哪些限制是你当初想突破的?

Sam Altman科幻小说在一点上预测得很准:界面最终会融化,变得无感。现在的语音界面还挺糟糕。但想象一下,你对电脑说:这是我今天要完成的事,如果有变动,你帮我处理,别打扰我。它就自己处理了,而你完全信任它。这就是所谓融化的界面”——只有在它必须跟你沟通时,才像一位优秀的人类助手出现一下。对比现在的体验——拿起手机,就像走进时代广场:全是闪烁的灯、通知、干扰。让人很焦虑。我能想象未来的交互方式是这样的:电脑自动完成你需要的事,只把真正重要的内容呈现出来。

Garry Tan这也是你找来Jony Ive的原因之一吧?他可是活着的设计传奇。

Sam Altman他真的太厉害了,名副其实。过去50年里,计算机交互只有过两次重大革命:一次是键盘、鼠标、屏幕;一次是触控屏和智能手机。AI为我们打开了第三次的可能性——全新的交互方式。如果你要为下一代交互界面押注一个人,Jony是最显而易见的选择。

Garry Tan我们在YC最近有个讨论:未来的SaaS会不会就变成API + 数据库 + LLM界面?UI不再手写,而是由大模型即时生成。

Sam Altman这肯定会发生。我想说的是——如果你要创办一家初创公司,现在就是历史上最好的时机。为什么?因为整个技术地基正在震动。所以,是的,即时生成软件是趋势。这对某些传统SaaS公司会有冲击。但大家面临的是同样的变化,同样的机会。而每当产业周期剧烈变化时,初创公司就有优势:他们迭代更快、更灵活、没有那么多包袱。代码将变得廉价、快速、充足——而你,只要跑得比别人快,就能赢。

护城河与招聘

Garry Tan也许你该回来专门讲一场关于护城河的演讲——因为这正是人们最担心的问题:我该做点什么,才能经得起时间的考验?

Sam Altman好啊,挺有意思的。

Garry Tan你我都挺喜欢Peter Thiel。他经常讲要反主流,而且是对的。你显然做到了——尤其在早期。

Sam AltmanPeter是个天才。我们在很多事情上确实走的是反向,比如scaling laws。现在大家都觉得这显而易见,但当时它简直是反常识。面对质疑仍保持信念,这很难。你会听到很多声音说:你没有护城河。”“你会被碾压。”“这根本行不通。没有什么作弊方法,只能坚持。坚持久了,会更容易一些。

Garry Tan聊聊招聘吧。你带过世界上最顶级的团队。你学到最难的教训是什么?很多人从没招过人,更别说劝一个拿着几十万美元薪水的人放弃一切来加入革命了。

Sam Altman招到那种聪明、有冲劲、高产出、还能融入团队的人,基本就成功90%了。大家往往关注错了地方。初创公司早期,我不推荐招那种特别资深、老练但本质上是行政型的人。经验当然重要,但不是在一开始。我永远更喜欢年轻、有干劲、能搞定事情的人,而不是履历光鲜的那种。在YC,我看申请材料时,从不先看履历。我直接跳到:你做过最令人印象深刻的事是什么?如果答案够好,也许我会看一眼简历,但那是其次的。Patrick Collison 有句我很喜欢的话:要招斜率高的人,不是y轴截距高的人。要找成长速度快的、好奇的、有韧性的人——而不是光鲜的title

Garry Tan那当OpenAICEO呢?这份工作最难的地方是什么?

Sam Altman我不推荐。不是哪个挑战特别难,而是挑战太多、太同时发生了。每天都有一堆完全不相关、却都无比重要的决策等你去切换处理……这超出了我原本认为人类能承受的范围。而且,还有不少大公司在各种方式上盯着我们。

Garry Tan往后看1020年,你个人最期待什么?在座的人现在该去构建什么,来迎接那个未来?

Sam Altman如果一切不出大差错,1020年内我们将拥有无法想象的超级智能。如果只能选一个我最兴奋的方向——那就是用AI来推动科学进步。所有长期可持续的经济增长、所有能真正改善人类生活的进步,最终都来自两件事:发现新的科学知识;再通过良好的治理把它大规模推广。如果AI能大幅提升科学发现的速度,长期复利的影响将是深远的。

能源与未来愿景

Garry Tan你当年把 Helion 的创始人 David Kirtley 招进 YC,是不是从很早就关注核聚变了?

Sam Altman说来有点不好意思——我其实很早就迷上了 AI 和能源,一直觉得它们是最重要的两件事。但直到创办 OpenAI 后,我才意识到它们之间的关系其实非常紧密。我以前觉得它们是正交的:AI 用来产生创意,能源用来驱动一切。但现在很清楚了——能源限制了我们能运行多少智能。

Garry Tan有那张图——每个技术加速主义者都喜欢的——显示人均能耗和生活水平之间是强相关的。

Sam Altman那张图我超着迷。我觉得那是历史上最惊人的图之一。纵观整个人类历史,生活质量和能源富足是密切相关的。这就是我最初痴迷能源的原因。而现在我会想的问题是:在只靠 GPU 运算的情况下,我们最多能发多少电,才不会把地球过热?”“我们什么时候需要把算力搬到太空?

Garry Tan术乐观主义者常常相信激进的富足。如果未来我们拥有即开即用的智能无限能源,那个世界会是什么样?

Sam Altman从没去过那些负增长大会——就是欧洲那种。我还真想去看看,在寒冷、黑暗、没有手机的地方,听人说没有希望了。我就是无法共情那种心态。这个世界——初创公司、旧金山、AI、乐观主义——才是我精神归属的地方。我基本确定,我们是对的,他们是错的。

Garry Tan那我们该怎么实现这种富足?需要什么?

Sam Altman大概就在五年前我们第一次把 GPT-3 放进 API,当时几乎用不了,有点丢人。但这五年里,我们从那种半成品,走到了现在大多数领域具备博士级智能的模型。如果我们能再保持这样的进步五年,并且建好支撑它的基础设施,那么开发者就会知道该怎么用它了。最好的类比是晶体管:它是一个全新的科学发现,然后整个社会开始动手实践,随之而来的是巨大的价值创造。这次的曲线会更陡、更快。我们现在只需要:把技术做出来,把科学搞清楚,把基础设施规模化,然后让你们去把它落地到真正的需求中。

早期经历与对年轻创业者的建议

Garry Tan让我们回到2005——第一批YC。你是怎么知道Paul Graham的?

Sam Altman我当时在读他的文章,他有一群铁粉。我是通过Blake Ross知道当时叫夏季创始人项目的,他在Facebook上发过消息,我们住同一个大一宿舍。Paul说,哦,你是大一新生?还有一批人要招。有趣的是,我最近翻出了那封邮件,故事是我写了我是大二,我会来的。但我当时写得更客气一些,我说:可能有误会,我其实是大二。如果可以的话,我很想参加。

Garry Tan你现在站在3000人面前,他们都处在你当年的位置。你会对年轻的自己说什么?

Sam Altman我希望有人早点教我,长期坚持信念和韧性的重要性。刚开始挺容易,但你会渐渐感到疲惫。要学会:相信直觉,完善决策,有勇气做你相信的事,即使它不合时宜,经历失败后继续前行。我的第一个创业没做成,很多人失败一次就放弃,但你必须继续坚持。

我最近有了孩子,大家都说:这是你做过最棒但也是最难的事情。这都是真的,这也是创业的真实写照:好的部分比你想象的还美好,难的部分比任何人说的都要难。但你必须坚持走下去。

原视频:Sam Altman: The Future of OpenAI, ChatGPT’s Origins, and Building AI Hardware

https://www.youtube.com/watch?v=V979Wd1gmTU

编译:Kun Yang,关注AI对齐和AI Agent等科技领域。欢迎交流。

请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。

Z Potentials将继续提供更多关于人工智能、机器人、全球化等领域的优质内容。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。

——-

(文:Z Potentials)

发表评论