随着人工智能(AI)在各个领域的引入和融合,技术的发展速度可以说是非常快的。它已经从幕后工具逐渐转变为界面本身。我们见证了从只能勉强拼凑出连贯句子的聊天机器人,到能够进行完整播客对话的 AI 代理的转变,这些 AI 代理帮助人们学习、思考,甚至放松身心。

随着这种以无障碍为中心的创新浪潮的传播,谷歌搜索现在也迎来了自己的音频变革。
作为搜索实验室(Search Labs)的一项新实验,谷歌正在测试一个名为“音频概览”(Audio Overviews)的功能。它将 AI 概览已经能够做到的事情——为复杂的搜索查询提供快速摘要——转化为简短的、类似播客的音频片段。现在,你可以选择收听两个 AI 声音像日常对话一样讨论这个话题,而不仅仅是阅读摘要。

这些声音由谷歌的 Gemini AI 模型提供支持,你无需做太多操作就能触发它们,只需搜索谷歌认为“适合音频”的主题。如果可用,你会看到一个提示,上面写着“搜索实验室 | 音频概览”,并附带一个迷你音频播放器,你可以在这里播放、暂停、控制音量,甚至加快音频速度。
生成音频片段大约需要 40 秒,你还会看到一个用于构建摘要的来源列表。你可以把它想象成一个专为你量身定制的 AI 播客节目,按需生成。
这个想法并非完全新颖。“音频概览”最初出现在谷歌的 AI 驱动的笔记应用 NotebookLM 中,它通过将 PDF 等整个文档转化为语音摘要,帮助用户消化内容。随后,同样的技术被添加到 Gemini 应用中,现在它又被移植到谷歌搜索中。下一个将获得音频处理的内容是什么,目前还不得而知。电子邮件?YouTube 评论?
不管怎样,这并不只是一个噱头。谷歌每月有超过 15 亿用户,分布在 100 多个国家,因此如果这一趋势持续下去,“音频概览”可能会成为那些希望在开车、做饭或只是避免使用屏幕时获得免提答案的用户的首选学习工具。

话虽如此,该功能目前仍处于早期测试阶段,仅通过搜索实验室向有限数量的用户开放。但这是另一个迹象,表明搜索不再仅仅是关于关键词,而是关于对话——即使这些对话是由 AI 生成的。
(文:AI音频时代)