Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?

久违的 Lex Fridman 又来采访 AI 行业的关键人物了。

这次是 Google CEO Sundar Pichai。过去半年,Google 凭借 Gemini 2.5 完成了 AI 竞赛的追赶,某种意义上说,Google 和 OpenAI 现在站在了同一起跑线。

Lex 的播客一向聊的广且深,这次也不例外,Pichai 这一年的困境、核心产品搜索的未来方向、模型和 Sclaing Law,AI 编程、具身智能、AGI、ASI 还是 AJI 的探讨。

很多时候,问对了问题,好的采访就完成了一大半。Pichai 的回复,确实有蛮多干货。

2 小时多的播客,编译时我们做了一些删减。

原始播客:https://www.youtube.com/watch?v=9V6tWC4CdFQ&t=2711s

TLDR: 

  • 谷歌对于未来搜索的设想是,在搜索中部署了最强的模型,这些模型会围绕每一个查询执行多路径检索,并整合信息,最终把用户引向真正有价值的内容。

  • 随着 AI Mode 功能的成熟,谷歌会将其迁移到主页面上,可以看作是一个连续的统一体:AI 模式会为用户提供最前沿的体验,而其中验证有效的部分会流入 AI 概览与主搜索体验中。

  • 从第一性原理角度出发,模型的深度思考、推理不是靠人为地堆规则,而是从科学角度去构建模型的推理能力——比如处理数学、物理、历史这类话题时,要确保模型的理解和推理逻辑是扎实的。

  • 大约 30% 的代码是在 AI 提示的帮助下生成的。但最重要的指标,也是我们仔细衡量的,是我们如何评估 AI 对公司整体工程开发速度的影响。

  • 计算领域最好的创新往往都来自于范式 IO 的变革,比如从命令行到图形界面(GUI),再到移动设备上的多点触控和后来的语音交互。AR(增强现实)是下一个 IO (交互)范式。「Project Astra」项目对于未来的 Android XR 生态至关重要。

  • 我们现在正处于 AJI 阶段,即 Artificial Jagged Intelligence(非均衡人工智能)。尽管整体进步显著,但仍然存在不少不足。到 2030 年我们可能还达不到 AGI,需要更长的时间。

  • AI 最独特的核心在于,它能够递归式地自我改进。AI 是第一种能极大地加速「创造」本身的技术,创造新事物、构建新东西,它可以自行改进和实现。它最终产生的影响将远远超过我们以前见过的任何技术。

  • 一种说法是,未来内容会极大丰富,有时你会为了效率去消费 AI 生成的内容。但你所珍视的顶级体验,可能还是源自于人类本质的某种体现。


超 6000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

从输到赢,

Pichai 这一年做了什么

Lex Fridman:去年我们一起散步时,我不记得有没有谈到这个,但我记得在那之后,我看到了几十篇由分析师和专家撰写的文章,说 Sundar Pichai 应该下台。因为当时人们普遍认为,在快速发展的技术格局中,Google 已经明确地输掉了 AI 竞赛,失去了它的魔力。

而现在,一年后,情况变得疯狂。你展示了过去一年发布的所有产品的图表,这太不可思议了。就在我们今天谈话的时候,Gemini Pro 在许多基准测试和产品上都处于领先地位。带我回顾一下那段经历,当所有文章都说你是领导 Google 度过难关的错误人选,说 Google 迷失了方向,完蛋了的时候,到今天 Google 再次获胜。在那段时间里,有哪些低谷时刻?

Sundar Pichai这里有很多东西可以细说。显然,我作为 CEO 做出的主要赌注就是确保公司以「AI 优先」的方式处理一切事务,为负责任地发展 AGI 做好准备,并确保我们推出的产品能体现这一点,即对人们非常非常有用的东西。所以,即使在去年那样的时刻,我对自己内部正在构建的东西也有很好的了解。

我已经做出了许多重要决定,比如将 Brain 和 DeepMind 这样高水平的团队整合在一起,成立了 Google DeepMind。还有像我们十年前就决定投资 TPU 这样的事情,所以我们知道我们正在扩大规模并构建大模型。

我很擅长排除噪音,从噪音中分离信号。管理 Google,就像执教巴塞罗那或皇家马德里一样,总会有赛季不佳的时候。所以有这方面的原因。你要能排除噪音,同时留意信号。从噪音中分离信号很重要。有时外面会有优秀的人提出很好的观点,所以你想听取,想吸取那些反馈。但你必须专注于内部所做的一系列重大决策。

作为领导者,你要做很多决定,大部分其实是例行性事务,推动日常运营,但随着时间的推移,你发现日常做的大多数决定并不重要,你做它们只是为了让事情继续运转。但你必须做出少数几个关键的、有深远影响的决定。我们已经组建了正确的团队,有了正确的领导者,我们拥有世界一流的研究人员,我们正在训练 Gemini。

内部有一些因素,是外部人士可能没有意识到的。比如,TPU 很了不起,但我们也需要扩大 TPU 的规模,这需要时间来实际扩展以获得所需的计算能力。但我能从内部看到我们所处的发展轨迹,我对公司未来的可能性感到非常兴奋。对我来说,那一刻感觉是我们公司未来最大的机遇之一。未来十年、二十年的机遇空间比过去发生的一切都要大。我认为我们比世界上大多数公司都更有能力去实现那个愿景。

Lex Fridman你确实做出了一些重大而果断的决定,比如你提到的合并 DeepMind 和 Google Brain。也许是我的看法,仅仅是基于对人性的了解,我确信这其中涉及了很多个人意志和自尊,合并团队是非常困难的,而且我肯定你做出了一些艰难的决定。你能带我了解一下你思考这个问题的过程吗?你是如何下定决心并做出那个决定的?其中有哪些痛苦的时刻?

Sundar Pichai我们很幸运拥有两支世界级的团队,但你说得对,这就像有人来告诉你,把斯坦福和麻省理工合在一起,创建一个顶尖的系,说起来容易做起来难。但我们很幸运,这两支团队都很了不起,各有优势,运营方式也截然不同。Brain 当时有很多多样化的项目,自下而上,从中诞生了许多重要的研究突破。而 DeepMind 当时对于如何构建 AGI 有着清晰的愿景,他们在追求自己的方向。但幸运的是,在那些时刻,Jeff 表达了想回归更偏向科学的个人贡献者角色的愿望,他觉得管理工作占用了他太多时间。而 Demis 自然而然地,他当时在运营 DeepMind,成为了一个自然的人选。

但你说得对,我们花了一段时间才把团队整合起来。这要归功于 Demis、Jeff、Koray 以及所有在那里的优秀人才。他们非常努力地工作,在组建那个新团队时,结合了两个团队的精华。在整合的过程中,确实有过一些不眠之夜。我们很有耐心地处理这件事,以确保它能长期良好地运作。

Lex Fridman:在那段时期,无论是合并团队还是应对外界的噪音,有没有过让你感到挫败感爆棚的时候?

Sundar Pichai 也许有,你说得对。在某种程度上,确实有一段时间我们都在全力以赴。当你在战壕里满怀激情地工作时,总会有意见不合、争论的日子。但所有这些,都只是高强度工作过程中的一部分。归根结底,我们所有人做我们正在做的事情,都是因为它可能产生的影响,我们被此所激励。

对我们许多人来说,这是一段长期的旅程,所以它一直非常激动人心。积极的时刻远远超过了那些充满压力的时刻。就在今年年初,我有幸在两天内接连庆祝了 Geoff Hinton 获得诺贝尔奖,第二天又庆祝了 Demis 和 John Jumper 获得诺贝尔奖。当你和这样的人一起工作时,所有的一切都非常鼓舞人心。

Lex Fridman:有没有过那种情况,你必须坚定立场,也许是用更少的话语,或者直接说:我是 CEO,我们就这么做

Sundar Pichai 回到我之前提到的那些有深远影响的决定,有些决定你做出后,人们可能会激烈地反对,但到某个时候,你做出了一个明确的决定,然后就要求大家去执行。

你可以不同意,但现在是时候「求同存异,付诸行动」(disagree and commit),这样我们才能继续前进。至于这算不算「坚定立场」,这是我们所有人都必须做的自然而然的一部分。我认为你可以平静而又非常坚定地做出决定,如果你能清晰地做出决定,随着时间的推移,人们实际上会尊重这一点。

我发现在做这类决定的会议上,听取每个人的意见非常有效。有时你听到的东西实际上会影响你的思考方式,你会反复斟酌并做出决定。有时你有一个明确的信念,你就会说出来,比如「看,这是我的感受,这是我的信念」,然后你就下注,继续前进。

Lex Fridman有没有类似这样的重大决策?我猜合并团队就是其中之一。

Sundar Pichai我认为合并团队是当时我们能为公司做出的最关键决策之一。还有很多其他的事情,比如我们成立了一个 AI 基础设施团队,扩大我们所需的计算能力。

我们还让不同地区的人物理上聚集在一起,比如让 DeepMind 团队留在伦敦,而我们在山景城的团队则聚在 Gradient Canopy 办公大楼,那是 Google DeepMind 的总部。我每周都例行去几次,那里聚集着我们最顶尖的研究人员,他们正在训练模型,Sergey 也经常在他们中间,关注最新的模型进展、查看损失曲线等。我认为,让团队重新凝聚起来,带着活力,这种文化部分最终也发挥了重要作用。


02 

搜索和广告,

未来都会迁移切到 AI 模式

Lex FridmanGoogle 搜索可以说是互联网的门户。那个极简的页面,上面只有十个蓝色链接,已经成为一种传奇。当人们想到互联网时,他们就会想到那个页面,而现在你们开始改变它了:AI 模式(AI Mode)作为一个独立的标签页,然后又将 AI 集成到搜索结果中,我猜在你们的会议上,一定引发了不少争论吧?

Sundar Pichai在某种程度上,当移动时代开始,人们希望得到更多问题的答案,所以我们其实一直在不断地演进。但你说得对,在这个时刻,由于底层技术变得更加强大,这种变化变得更加显著。AI 可以提供大量的上下文信息,但我们一个重要的设计目标是,当你来到 Google 搜索时,你会得到极其丰富的上下文,但你最终还是会去网络上发现很多东西。无论是在 AI 模式下,还是在 AI 概览(AI overviews)中,这一核心原则始终不变。

回到我们之前的对话,我们仍然提供传统的网页链接,但 AI 成为了一个辅助层,它能够整合上下文和摘要。在 AI 模式下,你甚至可以通过对话方式一步步探索信息,但整个过程依然围绕着「让用户更好地了解世界」。所以我们在原则上并没有背离搜索的初衷。我们在搜索中部署了最强的模型,这些模型会围绕每一个查询执行多路径检索,并整合信息,最终把你引向真正有价值的内容。这是我们对搜索未来的思考方式。

Lex Fridman我有机会听了 Elizabeth Reid (Liz) 的一些讲解,有两点让我印象深刻。一点是「查询扇出」(query fan-out),我之前都没想过,就是它能为你整合网络上的大量信息,这非常强大。它提供了上下文,让你能决定接下来要访问哪个页面。另一点非常重要,是生产力的飞跃。

你可能不太了解的一点是,AI 模式特别有助于非英语用户,在搜索信息时也能将英文网页内容纳入推理过程。当然,你可以用翻译工具阅读页面内容没错,但在信息检索的早期阶段,这种语言能力才是真正的「能力解锁」。如果你设身处地去体会世界上大多数非英语用户的处境,就会发现他们在互联网上能获取的内容范围其实小得多。而现在,借助像 Gemini 这样的模型,这个障碍在逐渐消失。

Sundar Pichai是的。Gemini 的多模态能力、翻译能力、推理能力,正在融入到搜索流程中,深度嵌入至产品中。特别是 AI 概览(AI overviews)功能,我们看到产品变得好多了,用户反馈也非常积极。从多个指标来看,它确实推动了产品的增长。同时,我们一直在测试 AI 模式,现在已经有数百万人用上了,早期的指标非常鼓舞人心。所以,我对搜索的下一个篇章感到兴奋。

Lex Fridman对于不了解当前搜索变化的人来说,可以这样理解:现在的模式是在十个蓝色链接的顶部有一个 AI 概览,它提供了一个很好的摘要,你也可以展开查看更多信息。

Sundar Pichai是的,而且现在摘要里还嵌入了来源和链接。

Lex Fridman我记得 Liz 曾经提到过,AI 概览里其实也包含广告。我倒是没注意到。AI 模式目前好像没有广告。Sundar,你觉得什么时候会在 AI 模式中加入广告?毕竟,广告让我们可以免费使用大量服务,广告不仅提供收入,也在理想情况下提供了相关信息,而且形式优雅、不打扰。你觉得未来 AI 模式里,广告会以怎样的方式出现?

Sundar Pichai 有两点。在 AI 模式的早期阶段,我们显然会更专注于原生的体验,以确保我们把它做对。我认为广告的价值在于它支撑起了服务的大规模部署,能服务数十亿用户。

其次,我们一直认真对待广告的原因是,我们视广告为商业信息,但它仍然是一种信息。所以我们用同样的质量标准来衡量它。对于 AI 模式,我认为 AI 本身将帮助我们找到最自然、最优雅的方式来呈现广告。AI 提供丰富的上下文,因此也能解释清楚,「这里有一条商业信息」。这就像你主持播客时在特定时段插入广告,找到最契合节奏的方式一样。这种做法未来也许会迁移到 AI 模式中。

不过,我们会重新思考广告的形式。你已经看到我们在 YouTube 上现在采用了订阅和广告混合的模式。显然,现在我们的多个产品线也都在引入订阅机制,因此整个商业模型的平衡点也会发生变化。

Lex Fridman在未来某个时间点,AI 模式可能会完全取代现在的「十个蓝色链接+AI 概览」这种组合形式吗?

Sundar Pichai我们目前的计划是,AI 模式将作为一个独立的标签页存在,供那些真正想体验的用户使用,但它目前还没有达到我们主搜索页面的水平。但随着功能的成熟,我们会继续将它迁移到主页面上,所以你可以把它看作一个连续统一体:AI 模式会为你提供最前沿的体验,而其中验证有效的部分会流入 AI 概览与主搜索体验中。

Lex Fridman而 AI 模式依然会把用户引导到人类创作的网站内容上,这一理念还会保留吗?

Sundar Pichai是的,这将是我们的一个核心设计原则。

Lex Fridman所以最终还是由用户决定,对吧?他们来驱动这一切。

Sundar Pichai是的。

Lex Fridman这很令人兴奋。但也有点吓人,因为它可能会改变互联网,因为 Google 一直以来都以一种非常特定的外观和理念主导着互联网的样貌。当你转向 AI 模式时,那是一种完全不同的体验。我想 Liz 谈到过,你也提到过,你会问更多的问题,问更长的问题。

Sundar Pichai是的,而且是完全不同类型的问题。

Lex Fridman确实如此,它甚至激发了我的好奇心。我会不断向这个「黑盒」一样的系统提出问题。AI 概览也很有趣,因为我依然重视人类内容,最终我还是会回到那些由人类创作的网页。但就像你说的,AI 提供的上下文实在太有帮助了。

Sundar Pichai它帮助我们提供更高质量的引荐,人们更容易找到他们真正想要的信息。他们在探索,他们充满好奇,他们的意图得到了更好的满足。从各项用户指标来看,我们都看到了正向变化。

Lex Fridman你之前还有 Dennis 都提到,未来的网络会有一部分专门为 AI agents 服务。我们可以把互联网分为两个层次:一个面向人类,另一个面向 Agent。你觉得未来为 Agent 构建的那一层会持续扩张吗?五到十年后,为人类创作的网页还会有意义吗?还是最终一切都由 Agent 掌控?

Sundar Pichai就像今天,不是所有人都在线购物,有些人还是喜欢去商店里走走、挑选商品,享受那个过程。但与此同时,你也在用外卖或电商平台。所以这两种体验是并行存在的。网站设计也会因人类使用而变得更友好——AI 实际上可能会帮助网站变得「更适合人类」。

所以我期望网络会变得更丰富、更有趣、更好用。同时,我认为也会有一个「Agent 网络」出现,但要让它良性发展,就需要建立清晰的商业价值体系与激励机制,让更多人愿意参与其中。

但我认为两者会共存。当然,AI Agent 不需要像人类那样的 UI 和交互设计范式。


03 

Less Structure, 

More Intelligence

Lex Fridman早期版本的 Gemini 在回答某些问题上有点过于谨慎。但我很高兴地发现,Gemini 1.5 Pro 变得不那么谨慎了。我最近研究成吉思汗、阿兹特克人以及两次世界大战,那段历史充满暴力。早期 Gemini 会表现出一种「你确定要了解这些吗」的感觉,而现在它非常实事求是、客观,能够深入、细致地谈论人类历史上艰难的部分,这真的很好。

但我想 Google 必须把握好一个度,如何在大规模上应对各种奇怪查询,这也是一个工程挑战。你能谈谈这个挑战吗?如何让 Gemini 在说一些「疯狂」的东西的同时,又不会太过火?

Sundar Pichai我认为这里一个很好的见解是,随着模型变得越来越强大,它们实际上非常擅长处理这类事情。所以在某种程度上,也许一年前,模型还没有完全到位,所以它们会更频繁地犯一些愚蠢的错误。因此,你试图处理那些边缘案例,但你在处理这些边缘案例时又会犯错,导致问题叠加。但我们特别发现,对于 1.5 版本,一旦模型的智能和复杂性超过某个水平,它们就能够很好地对这些微妙的问题进行推理。

我觉得用户其实是希望能尽可能接近「原始模型」的,他们希望看到模型真正的能力和判断力。未来,我们也应该让用户能更多地自定义提示、进行实验等等,这也是我们持续探索的方向。

我们想要思考的第一性原理是,不是靠人为地堆规则,而是从科学角度去构建模型的推理能力——比如处理数学、物理、历史这类话题时,要确保模型的理解和推理逻辑是扎实的。这才是构建 AI 系统的正确方式,而不是让一小部分人硬编码一些东西在上面。我认为这是我们一直在采取的方向,你会看到我们继续朝这个方向努力。

Lex Fridman我做了一堆笔记,然后把它们交给 Gemini 说:「你能不能根据这些笔记,再问一个我没想到的问题?」结果它真的提出了一个很特别的问题——「你曾说过,Gemini 每月处理 480 万亿个 token。那么,在这片信息海洋中,是否存在一句由五个词组成、足以改变人生的话?」这问题是 Gemini 问的,挺哲学的。

虽然我知道你不可能真的回答这个问题,但它让我意识到,这些 token 的背后,其实是一个个小小的「顿悟」时刻。人们通过好奇心发问,然后发现某些东西,有可能就此改变人生。

Sundar Pichai是的,很多年前,我刚接触搜索的时候就有类似的感受。在过去的 12 个月里,我们每月处理的 token 量增长了 50 倍。

Lex Fridman:顺便问一下,那个 480 万亿的数字准确吗?

Sundar Pichai是的,是准确的。我很高兴它算对了。12 个月前,这个数字是每月 9.7 万亿个 token。现在已经增长到 480 万亿,这是 50 倍的增长。人类的好奇心是无限的。我认为现在就是这样一个时刻,虽然今天还没到,但也许有一天,会有一个五个词的短语,说出宇宙的真相或某些非常有意义的东西,但我觉得我们还没到那一步。


04 

Scaling Laws 仍然有效,

算力依然受限

Lex Fridman:你认为规模法则(scaling laws)在预训练和后训练阶段是否依然有效?换句话说,AI 的进步会不会在某个阶段遭遇瓶颈?

Sundar Pichai这是我们偶尔会在公司茶水间常聊的话题,比如 Demis 来访时,或者当 Demis、Koray、Jeff、Norm、Sergey 这些人聚在一起时,我们就会聊这个。我们的共识是,前方还有很大的提升空间。我们一直在优化和改进所有方面:预训练、后训练、测试时计算、工具使用,以及随着时间的推移,让这些模型更具「Agentic」。我们的目标是朝着更通用的「世界模型」方向发展。

比如 Veo 3 在物理理解上比 Veo 1 就有了显著提升。几乎所有维度上都在进步,而我们也认为,还有更多空间可挖掘。更重要的是,我很幸运能和这个星球上一些最优秀的研究人员一起工作,他们也认为这里还有更多的发展空间。所以我认为我们未来的发展轨迹会非常激动人心。很难说具体会怎样,但每年我都会问自己:如果我们在明年投入 10 倍算力,是否会看到明显进展?目前看来,答案是肯定的。我对未来一年的进展抱有很大信心。

Lex Fridman你有没有感受到某些方面的限制,比如算力、数据或研究上的瓶颈?还是说现在一切都在顺利推进?

Sundar Pichai我认为在某种意义上是受算力限制的。我们之所以推出 Flash、Nano Flash 和 Pro 模型,而没有推出 Ultra 模型,部分原因就在于此。

Pro 模型的能力大约可以达到 Ultra 模型的 80%-90%,但速度更快、使用成本更低。而 Ultra 虽然更强,但推理速度慢、服务成本高。

所以我们的方法是,在下一代产品中,让 Pro 模型达到上一代 Ultra 的水平,同时又能以快速、易用的方式提供服务。所以我确实认为 Scaling laws 是有效的,但在任何一个时间点,我们最常使用的模型可能都比我们能提供的最强能力落后几个月,因为最强的那个版本不会是最快、最容易使用的。

Lex Fridman是的,而且在智能方面,衡量「性能」也变得越来越难。就像你们的 Gemini Flash,虽然比 Pro 更轻量,但因为延迟极低、反应非常快,它在很多实际场景下的「影响力」甚至更大。

有时候,低延迟比「更聪明」更重要,尤其当智能水平差距不大的时候。而 Flash 本身也已经足够聪明了。所以衡量模型能力,已经不能只靠传统的基准测试,而是要看它在现实世界里的影响力、实用性和效果。


05 
AI 编程
让谷歌的工程效率提效 10%

Lex Fridman我得问你一个关于编程的问题。AI 在编程方面正变得非常出色。Gemini,无论是作为 Agent 还是作为大型语言模型,表现都令人惊艳。所以很多程序员非常担心他们会失去工作。你觉得他们该有多担心?如何适应一个 AI 编写大量代码的新世界?

Sundar Pichai我认为有几点。以 Google 为例,我们给出了各种统计数据,大约 30% 的代码是在 AI 提示的帮助下生成的。但最重要的指标,也是我们仔细衡量的,是我们如何评估 AI 对公司整体工程开发速度的影响。虽然这很难衡量,但我们严格地尝试去衡量它,结论是目前我们整体的工程效率提升了大约 10%。

在整个公司层面上,10% 的开发效率提升已经非常显著了。而且我们计划明年招聘更多的工程师,因为我们能做的事情的机会空间也在扩大。

所以我认为,至少在短期到中期,对于许多工程师来说,AI 会释放出更多时间和精力——哪怕是在编码领域,也总有一些部分是枯燥的,比如重复性的工作。相比之下,架构设计、系统构建、问题求解,这些才是更有趣的部分。AI 的加入,能够把繁琐的部分自动化,让你有更多时间去专注于创造性工作、解决复杂问题,以及和同事们集思广益。

其次,我认为 AI 能让创造力的门槛降低,让更多人都能参与进来。这意味着会有更多的工程师做更多的事情。所以 AI 会不会取代人类,很难完全预测。但总的来说,目前,人们会采纳这些 AI 工具,成为更好的程序员。至少从我们在 Google 的观察来看,现在的趋势整体是积极的。

Lex Fridman确实。我听说一些非常优秀的程序员已经能生成大量代码,虽然他们不一定用得上全部代码,还是需要很多编辑,但就算对我这种把编程当副业的人来说,我也感觉自己的生产效率提高了五倍。我想,对于像 Google 这样拥有庞大代码库的公司来说,未来的生产力应该会有更大提升。

Sundar Pichai最大的突破,会出现在我们让「AI Agent」能力更强的那一刻。我认为,那将开启下一波真正的飞跃。别看只是 10%,但当你有成千上万名工程师时,10% 就是一个惊人的数字。人们常提到「AI 编写了多少比例的代码」,但我更关注的是实际的生产力。这是两个完全不同的维度,而后者才是更重要的衡量标准。但我相信效率还会继续提升。没有哪个工程师在效率翻倍后会就此止步,相反,他们会去创造更多有价值的东西,从而在工作中获得更深的满足感。

Lex Fridman是的,还有很多方面会随之改变。比如 Google 的代码库本身也可能变得更标准化,更易于理解和维护。AI 能在这方面发挥很大作用,帮助工程师在整个代码库中快速理解上下文,也会进一步增强 AI 自身对代码的理解。

我一直在大量使用 Cursor 作为一种用 Gemini 和其他模型编程的方式。它强大的地方之一是它能感知整个代码库,这让你能向它提问。它允许 Agent 以一种非常强大的方式在代码库中「自由穿行」。我的意思是,这是一个巨大的突破。

Sundar Pichai是的没错。比如说做代码迁移、重构老旧代码库等。一旦我们能以一种比今天更好、更稳健的方式完成所有这些工作,就会带来巨大价值。

Lex Fridman重构,是的。最终,我猜所有程序都将用 JavaScript 写,然后在 Chrome 里运行。说到这个,Google 以对工程师面试严格著称,尤其是白板面试非常有名。在 AI 时代,这种面试方式会发生变化吗?我猜白板上是不能用 AI 提示的吧?

Sundar Pichai这是一个很好的问题。我们正在确保至少为人们引入一轮现场面试,只是为了确保基础知识扎实。我认为这最终会很重要,但这也是一项同等重要的技能。如果你能利用这些工具生成更好的代码,我认为这是一种资产。所以总的来说,我认为 AI 的出现对于工程师来说是一个巨大的积极因素。

Lex Fridman那对于那些对编程感兴趣,但不是全职从业者的人,或者我们说「氛围编程」(vibe coding)爱好者,你是否还建议他们去接受传统的计算机科学教育呢?

Sundar Pichai我会建议的。如果你对计算机科学有热情,那就值得去学习。计算机科学远不止编程,它更多的是一种对系统性思维和底层逻辑的训练。所以我不认为 AI 会改变学习这些东西的价值。而且,AI 的影响是跨领域的,它正在影响所有行业。未来具体会如何变化,现在很难预测。但任何能够训练你「第一性原理」思维能力的教育,我认为都是非常值得的。


06

AR 是下一个重要的 IO 范式

Lex Fridman:你和团队改变了很多行业,其中 Android 系统更是颠覆性的。它的未来会是什么样?会更加以 AI 为中心吗?尤其是在加入了支持 AR 和 VR 的 Android XR 之后。

Sundar Pichai:计算领域最好的创新往往都来自于范式 IO 的变革。比如从命令行到图形界面(GUI),再到移动设备上的多点触控和后来的语音交互。我认为,AR(增强现实)就是下一个 IO (交互)范式。

之前它一直受两方面制约。一方面,制造好的 AR 设备的系统集成挑战非常非常大;另一方面,你需要 AI 的辅助。否则,传统的输入输出方式太复杂,无法为 AR 提供自然无缝的交互体验。因此,AI 变得至关重要,这也是为什么「Project Astra」项目对于未来的 Android XR 生态如此关键。

我相信,当你戴上 AR 眼镜时,你会惊讶于它的实用性。所以,我认为这对 Android 来说是一个真正的机会。XR 是一种让它真正实现的方式,但同时,它也给了我们一个重新思考移动操作系统的机会。我们一直生活在应用程序和快捷方式的范式中,所有这些都不会消失。

但同样,如果你想在操作系统层面完成一些事情,它需要更具「Agentic」,这样你就可以描述你想做什么,或者它能主动理解你试图做什么,从你一遍又一遍的做事方式中学习,并不断实现个性化。这正是我们需要解锁的潜力。

Lex Fridman:我体验过那款 AR 眼镜的原型,非常惊艳。那种毫无延迟、信息呈现恰到好处的流畅感,背后一定是在操作系统层面解决了很多难题,才能让 AI 如此无缝地整合进来吧?

Sundar Pichai:这是一个很好的登月项目,你知道吗?

Lex Fridman:是的,这太疯狂了。

Sundar Pichai我喜欢这个挑战。而且我相信,相比其他「登月项目」,我们离现实更近。我们预计今年晚些时候能将眼镜交到开发者手中,明年交到消费者手中。所以这是一个激动人心的时刻。


07

自动驾驶最困难的部分

在于最后的 20%

Lex FridmanWaymo 是我见过最疯狂、最具远见的登月项目之一。十多年前,当我第一次看到一辆 Waymo 车辆,也就是 Google 的自动驾驶汽车时,对我来说,那是一个关于机器人的「顿悟」时刻。它让我比以前更爱机器人技术,让我窥见了未来的一角。同时,恭喜你们完成了 1000 万次付费的机器人出租车(Robotaxi)服务。你从这个长期项目中获得了哪些重要的教训?

Sundar Pichai我对 Waymo 的进展感到无比自豪。自动驾驶的挑战在于最后的 20%,它比前面 80% 更难、更耗时。我认为我们当时确实在 Waymo 上经历了那个阶段,我意识到了这一点,但我们知道正处于那个阶段。

我们知道,尽管当时有很多其他自动驾驶公司,且技术差距是存在的。在别人质疑 Waymo 的那一刻,我反而做出了更多投资 Waymo 的决定。所以在某种程度上,这有点反直觉。但我认为,我们一直是一家深耕技术的公司,而 Waymo 就是构建一个能良好工作的 AI 机器人的一个版本,所以我们会被这类问题所吸引。那里的团队水平非常高,都是现象级的团队。

我们始终将宏伟目标和安全性放在同等重要的位置,对两者都同等投入并努力推进。今年,我们确实扩大了很多规模,并且在 2026 年会继续扩大。

Lex Fridman特斯拉也在推进 Robotaxi 项目。你怎么看待他们的进展?你喜欢这种技术上的竞争吗?

Sundar Pichai:我们其实是 SpaceX 的早期投资者,对他们一直都很支持。我认为,我们不直接与特斯拉竞争。我们不生产汽车,而是专注于开发通用的 L4/L5 自动驾驶系统。

我一直默认埃隆无论做什么都会成功,所以我对此毫不怀疑。这个领域足够广阔,我看到的是一个巨大的蓝海市场,特斯拉会做得很好,Waymo 也会做得很好。

Lex Fridman:其实 Waymo 本质上就是一个「有四个轮子的机器人」。你认为,未来下一个机器人领域的突破会在哪里发生?

Sundar Pichai:Demis 和 Google DeepMind 团队非常专注于 Gemini 机器人技术。我们正在开发基础模型,也在这方面投入了大量资金,我认为我们的研究也处于相当前沿的水平。我们在思考和布局机器人的应用,目前正在与一些公司合作,这是一个值得期待的领域。

我们还没有完全向外界阐述我们的计划,我认为 AI 最终会推动机器人的巨大进步。这个领域已经被耽搁了一段时间。硬件已经取得了非凡的进步,软件一直是挑战。基础模型的出现给机器人领域带来了突破的可能性。


08

我们正处于非均衡人工智能阶段

Lex Fridman:很多人在讨论 AGI(通用人工智能)或 ASI(超级人工智能)的到来时间。AGI 的宽泛定义是在人类追求的许多主要领域达到专家水平,而 ASI 是指在这些领域中远超人类智能的阶段,可能是通过 AGI 的自我改进演化而来。你觉得我们什么时候能拥有 AGI?2030 年有希望吗?

Sundar Pichai:我们应该再加一个术语,虽然我不知道最早是谁提的,也许是 Karpathy,叫做 AJI——Artificial Jagged Intelligence(非均衡人工智能)。

你听说过这个说法吗?有时候这确实是个很贴切的描述。我们看到模型在某些方面取得巨大突破,但同时它们还会犯很低级的错误,比如搞错数字,或者数不清「strawberry」里有几个「r」——这类问题大多数模型仍然搞不定。

所以我觉得,我们现在正处于 AJI 阶段,尽管整体进步显著,但仍然存在不少不足。不过,如果你的问题是:到 2030 年我们能否实现 AGI?这就要看你怎么定义 AGI 了。我们其实一直在不断重新定义它的边界。比如我在旧金山街头坐上一辆 Waymo,车子在人群中穿梭,有时候似乎还有点「不耐烦」,努力寻找出路;或者你在使用 Gemini Live 的 Astra,向它提问世界上的各种问题,那些时刻你会觉得:「这不就是 AGI 的影子吗?」

你能看到一些端倪,所以我用 AJI 这个词,但同时也很清楚,显然我们离 AGI 还很远。因此,我喜欢用「AJI」这个词来描述现在的状态,因为它反映出这种非对称的智能表现。

至于你的问题,我还是想回答一下。我的判断是,到 2030 年我们可能还达不到 AGI,那需要更长一点的时间。当然,我也不觉得「是否达到 AGI」这个定义本身那么重要,更重要的是:到 2030 年,我们将在许多维度上取得飞跃式的进步,无论是积极的效应,还是我们必须认真应对的负面影响,这些变化都将是巨大的,我对此深信不疑。

你可能会说,也许到时候 Gemini 会告诉我们,「现在就是 AGI 的时刻」。但在我看来,即便它不能那样宣布,变化也将是深远的。我记得 2010 年 DeepMind 初创时,就曾设想 20 年内实现 AGI,如今已过去一大半,那种回望过去的视角本身也很有趣。

比如 2012 年,Jeff Dean 展示了神经网络能够识别出猫的照片,那是 Google Brain 的早期成果。到 2014 年,我们收购了 DeepMind。对于我来说,这是一段我们已经谈论了十几年的旅程,我不认为 AGI 会在 2030 年完全实现,更可能再晚一些。

不过我再次强调,重点不在于「定义是否成立」,而是:我们正处于快速演进的阶段,也许 AI 到时候已经可以自动生成视频了。我们作为一个社会,需要有相应的机制来标注和披露这些内容,否则我们如何区分现实和 AI 生成内容?

Lex Fridman你说得非常有意思。回顾 Google Brain 的早期成果,当时 TensorFlow 还没开源,连工具都很原始。后来 GitHub 的兴起促进了代码共享,再到 Transformer 的问世,现在是 Diffusion 模型。也许未来又会有一个看似简单但彻底改变一切的新想法,比如在训练后期或推理阶段的突破。

我记得 shadcn 发过一条推文,说 Google 其实只差一个出色的 UI(用户界面)就能赢得 AI 战争,这其实也是强调 UI 在整个系统中的重要性。现在我们发布的是 LLM 模型,但未来的发布可能是完整的系统。在你看来,系统的呈现方式、它如何展示自己给世界,是不是特别重要?

Sundar Pichai:非常重要。有很多简单的 UI 创新改变了世界,未来几年我们会看到更多进步,因为 AI 本身就是一个能够自我改进的系统,UI 也包含在其中。今天,我们在某种程度上还在限制模型的表达能力,让它们无法通过 UI 真正展示自己。但从理论上讲,既然模型本身具备编程能力,它们应该能写出最适合表达自身思想的界面。

Lex Fridman:这是一个绝妙的想法。API 已经开放了,所以你可以创建一个非常好的 Agent 系统,不断改进你与 AI 对话的方式。但说到底,核心问题还是界面本身。而 Google 一直在推动的是那种真正多模态的交互方式。

Sundar Pichai:是的,这些模型是原生多模态的。它们可以轻松接收任何格式的输入,并生成各种形式的输出,它们可以设计出优雅的 UI,未来甚至可以理解你的个人偏好。所以这一切都是未来的发展方向。这也回到了我们谈话的起点,我认为未来几年将会有巨大的演变。

Lex Fridman现在有个挺热的话题叫做 「P(doom)」(灾难概率),即 AI 导致人类灭绝的可能性。你对这个说法怎么看?你认为它被夸大了吗?还是说,人类确实存在被 AI 摧毁的风险?

Sundar Pichai:是的,我有想过。我一直对 AI 非常兴奋,但同时也一直觉得,对于这项技术,你必须更多地思考其风险。

关于 p(doom) 的问题,这也是我们在茶水间偶尔会谈起的话题,这并不奇怪。毕竟这项技术太强大了。也许我们该换个角度思考:当你运营一个大型组织时,如果你能协调好组织的激励机制,你几乎可以实现任何事情。如果你能让所有人都朝着一个目标、以一种使命驱动的方式前进,那简直无所不能。

但要以这种方式组织全人类是非常困难的。不过我认为,如果 p(doom) 真的很高,到某个时刻,全人类都会团结起来,确保这种情况不会发生。因此,我们实际上会在应对这个问题上取得更多进展。所以讽刺的是,这里面存在一个自我调节的因素。我认为,如果人类集体下定决心去解决一个问题,无论是什么问题,我们都能做到。因此,我对于 p(doom) 的情景持乐观态度。我认为潜在的风险确实很高,但我对人类能够奋起迎接那一刻抱有很大的信心。

Lex Fridman说得非常好。当威胁变得更加具体和真实时,人类确实会团结起来,把事情办好。另外,我认为人们不常谈论的是没有 AI 的毁灭概率。人类还有很多其他方式可以自我毁灭,而且很有可能,至少我这么认为,AI 会帮助我们变得更聪明,对彼此更友善,更有效率。它将帮助世界上更多地区繁荣发展,减少资源限制,而资源限制往往是军事冲突和紧张局势的根源。所以我们也要考虑到这一点,没有 AI 的 p(doom) 是多少?因为很有可能 AI 将是拯救我们,拯救人类文明免受所有其他威胁的东西。

Sundar Pichai:我同意你的看法,这确实很有启发性。就像你说的,我觉得要解决一些最棘手的问题,最好有 AI 来帮助你,比如 Pear  一类复杂系统。


09

AGI 到来时,

问的第一个问题是什么?

Lex Fridman:如果有一天,谷歌真的创造出了能回答任何问题的通用人工智能(AGI),你会想和它聊些什么?

Sundar Pichai:这是个很好的问题。也许到那时它已经很主动了,会告诉我一些我应该知道的事情。但如果非要我问它,我想它会帮助我们以一种会让我们惊讶的方式更好地了解自己。所以也许是这个。你已经看到人们在用产品这么做了,但在 AGI 的背景下,我认为那会非常强大。

Lex Fridman:是在个人层面,还是关于普遍的人性?

Sundar Pichai:个人层面。

Lex Fridman:好的。

Sundar Pichai:所以你和 AGI 交谈,我认为它很有可能以一种非常深刻的方式理解你,我认为这是一种可能性。当然,还有一个显而易见的事情,也许它能帮助我们更好地理解宇宙,以一种拓展我们对世界理解边界的方式。那将是超级令人兴奋的事情。但说实话,我真的不知道。我还没接触过那么强大的东西,但我认为这些都是可能性。

Lex Fridman:我认为在个人层面上,问一些关于自己的问题,一系列关于什么让我快乐的问题,我想我们会非常惊讶地通过一系列问答发现,我们可能会探索一些深刻的真理,就像有时伟大的艺术、伟大的书籍、与爱人的伟大对话向我们揭示的那样。那些事后看来显而易见,但在被说出来时却很美好的东西。

但对我来说,首要问题是,宇宙中有多少外星文明?百分之百。

Sundar Pichai:这会是你的第一个问题?

Lex Fridman第一个,有多少存活的和已经灭亡的外星文明?可能还有一堆后续问题,比如它们有多近?它们危险吗?如果没有外星文明,为什么?或者如果没有先进的外星文明,但到处都有类似细菌的生命,为什么?阻止它们发展到那个阶段的障碍是什么?是不是因为当你变得足够聪明时,你最终会自我毁灭?因为你需要竞争才能发展出先进的文明,而竞争会导致军事冲突,冲突最终会杀死所有人。我不知道,我会进行那样的讨论。

Sundar Pichai:给费米悖论找个答案,是吧。

Lex Fridman:正是如此。并且就此进行一场真正的讨论。我现在意识到你的答案更具建设性,因为我不确定我会用那些信息做什么。但也许它揭示了 Liz 谈到的普遍的人类好奇心,我们都只是非常好奇,而让世界信息变得可及,能让我们一部分好奇心得到满足。有了 AI,我们可以变得更好奇,更多地了解世界,了解我们自己。这样做的时候,我总是在想,不知道你是否能评论,是否有可能衡量,不是我们谈到的 GDP 生产力的提升,而是 Google 通过 Google 搜索,以及现在通过 AI 模式和 Gemini,所解锁的人类知识的广度和深度。这是一个很难衡量的事情。

Sundar Pichai:很多年前,我记得是麻省理工学院的一项研究,他们估算了 Google 搜索的影响。他们基本上说,这相当于,按人均计算,每年为每个人创造了数千美元的价值。但是,是的,这些东西很难捕捉,对吧?当这些东西出现时,你把它视为理所当然,而前沿在不断移动。但你如何衡量像 AlphaFold 这样的东西随时间推移的价值呢?

Lex Fridman:还有当你学到更多东西时生活质量的提升。我得说,在我用 AI 完成的一些编程工作中,出于某种原因,我反而对编程更感兴趣了。

Sundar Pichai:是的。

Lex Fridman:对于知识也是如此,发现关于世界的事情,会让你对活着更感兴奋。它让你更好奇,而你越好奇,生活和体验世界就越有意思。这很难……我不知道这是否让你更有生产力,可能远不及它让你对活着感到快乐的程度。而衡量生活质量的提升是很难的,但其中一些东西确实做到了。


10

放在人类史,

AI 将是比电还要重要的科技发明

Lex Fridman:纵观人类数万年的技术创新史,从农业革命到工业革命,再到电力,诞生了无数生产力倍增器。你认为,一千年后,当后人修史时,人工智能(AI)能否位列榜首?

Sundar Pichai:这是个很好的问题。大概在 2017、2018 年左右,我当时说,AI 是人类将要面对的最深刻的技术,它将比火或电更具深远影响。我现在仍然这么认为。

你问这个问题时,我确实也在思考,我们是否存在「新近度偏误」(recency bias)?在体育界,人们很容易将当前看到的球员称为史上最佳。但我从第一性原理出发,依然认为,AI 将比所有那些发明都更重要。当然,我没有经历过那些时代。两年前,我做了一次手术,我当时在想,曾经人们在做这些手术时是没有麻醉的。那一刻,我觉得麻醉一定是人类有史以来最伟大的发明。我们无法体会生活在那个时代是什么感觉。

你提到的很多东西,比如电力或互联网,都是普适性的,几乎影响了所有领域。但我认为,我们见过过一种技术,它既发展得如此之快,能力变得如此强大,以至于其上限都难以估量。

AI 最独特的核心在于,它能够递归式地自我改进。

事实上,它是第一种能极大地加速「创造」本身的技术。创造新事物、构建新东西,它可以自行改进和实现。我认为这是它最与众不同的一点。所以,它最终产生的影响将远远超过我们以前见过的任何技术。当然,随之而来的是许多需要我们思考和应对的重要问题,但我对此深信不疑。

Lex Fridman:尤其是当 AI 在自身研究上,展现出超越人类的能力时。它或许有能力日复一日地,以比昨天更高效的方式创造自己。

Sundar Pichai:就像 AlphaGo 研究中的第 37 手棋一样,AI 能够进行新颖的、自我导向的研究。当然,在很长一段时间里,我们都希望人类能始终参与其中。这些都是需要讨论的复杂问题。但是,当你亲眼目睹 AlphaGo 如何从零开始,在一天之内变得比任何人都强时,那种震撼是发自内心的。

即使是像 Veo 3 这样的模型,如果你在它们完成 30% 和 60% 时分别审视其生成的内容,再对比最终的成品,你会看到这一切是如何融合在一起的。作为人类,我会说这既鼓舞人心,又有点令人不安。我想,这两种感受都是真实存在的。

Lex Fridman回顾第一次农业革命,它并不是单一的技术,而是催生了陶器、社会等级、早期政府等一系列连锁效应的「技术包」。尽管难以预测,但你认为我们今天能看到「AI 技术包」中哪些早期的二阶或三阶效应?

Sundar Pichai:其实大部分我们今天可能还不知道,但有一点我们现在可以切实看到的是,随着编程能力的进步,有一点已经可以切实感受到:将你头脑中的想法转化为实际存在的东西将变得非常容易。这是「AI 技术包」的一部分,它将赋予几乎全人类创造和表达的能力。

过去你可能只能用语言表达,未来你可以将想法直接构建成现实。也许今天还不能完全做到,我们还处于「氛围编程」(vibe coding)的早期阶段。但我对人们用 Veo 3 在网上发布的作品感到惊讶。虽然目前还需要一些技巧,比如将一系列提示词拼接起来,但这一切都将持续进步。我一直在想:在任何特定时刻,AI 都处于它有史以来最差的状态。

Lex Fridman:你首先想到的是创造力获取的指数级增长,这很有趣。

Sundar Pichai:无论是编写软件、创作内容,还是开发未来的游戏,所有这些创造性活动的门槛都将大大降低。

Lex Fridman:我认为最重要的是它降低了门槛,解锁了全部 80 亿人的认知能力。

Sundar Pichai:我同意。想想 40 年前,也许在美国只有五个人能做你现在做的事情。

想想看,今天通过 YouTube 和其他产品,有多少人在做同样的事。我认为这就是科技的作用。当互联网催生了播客,你听到了更多人的声音。但有了 AI,我认为这个数字将不再是几十万,而是数千万,甚至可能是十亿人,以更深刻的方式向世界展示他们的作品。

Lex Fridman这种创造力格局的改变,让许多传统媒体感到紧张,因为任何人都有可能成为创作者。未来甚至可能出现比人类制作更出色的 AI 播客。创作者必须不断进化,这虽然带来了压力,但也预示着一个激动人心的未来。

Sundar Pichai:但我想说的是,在一个拥有 AI 的世界里,人类会更加珍视和主动选择某些东西。就像在国际象棋中,你我绝不会去看 Stockfish 10 和 AlphaGo 两个 AI 对弈,那对我们来说会很无聊。但马格努斯·卡尔森和古克什的比赛会更有趣。所以,这很难说。

一种说法是,未来内容会极大丰富,有时你会为了效率去消费 AI 生成的内容。但你所珍视的顶级体验,可能还是源自于人类本质的某种体现。比如梅西的运球,也许未来会有机器人的球技远超梅西,但我不确定它能否在我们心中唤起同样的情感。这会是一个值得观察的有趣现象。

Lex Fridman或许未来,播客中纯粹的信息传递部分可由 AI 高效完成,而人类的价值则体现在努力理解、解读信息并与自身情感结合的过程中。就像 YouTube 改变了媒体一样,AI 会继续重塑我们发现、消费和创造信息的方式。

Sundar PichaiYouTube 成就了无数的创作者,这一点你比任何人都清楚。我毫不怀疑,AI 将成就比以往任何时候都多的电影制作人。我们会赋予更多人力量。所以我认为,AI 的赋能和扩张潜力,其价值被低估了。它将以前所未有的方式释放人类的创造力。这其中的深远意义,我们今天还很难完全领会。唯一的类比是,如果你把一个上世纪四五十年代的人带到今天,让他看看 YouTube,他一定会被彻底震惊。同理,在未来一二十年里,我们也将被 AI 所开启的可能性深深震撼。

Lex Fridman:你认为未来多少年后,顶尖的优质内容中可能会有一半是由 Veo 系列模型生成?

Sundar Pichai:我认为这取决于内容是什么。也许你看看今天的电影,里面大量使用 CGI,但仍然有伟大的电影制作人。你仍然会关注导演是谁,以及他们如何使用这些技术。有些电影制作人根本不用它,而你也珍视这一点。还有些人则运用得令人难以置信。而另一些人,比如詹姆斯·卡梅隆,则能将技术运用到极致。

但我认为会有更多的内容被创造出来。就像今天的作家使用 Google Docs 一样自然,未来的创作者也会无缝地使用这些 AI 工具的升级版本,对他们来说,这根本不是什么大不了的事。




(文:Founder Park)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往