语音更像真人、搜索前先思考？ChatGPT 这波悄悄升级挺有料

刚刚过去的周末（具体来说是 6 月 8 日），OpenAI 又悄悄扔了两个小炸弹：

一个是 高级语音模式（Advanced Voice Mode）升级，一个是 ChatGPT 4o引入“先思考再搜索”机制。

两个更新都挺有料的，重点是 —— OpenAI 没搞大新闻、没搞直播发布会，就这么静悄悄地推送给了 ChatGPT 全体付费用户。

尤其是语音模式的升级，感觉终于开始往“有灵魂的语音助手”靠近了。

先说结论：这波语音升级，是真能打的。

虽然之前的 AI 语音功能已经很强，看上去有模有样，但一说话还是避免不了些许“AI感” —— 语气太平、情绪假、节奏奇怪。

这次更新之后，语音、语调和情绪的自然度明显提升。

它开始会：

虽然还做不到 100% 自然，但已经很逼近“配音演员式”对话体验了。

尤其是在处理“带点情绪”的语句时，已经不像以前那样一板一眼。

而且这次还有个特别实用的新功能：持续翻译。

之前的翻译需要一轮一轮触发，现在，你只要和它说一句“请帮我翻译”，它就会进入翻译模式，接下来的所有对话，它都会自动双向翻译，直到你告诉它“停止翻译”。

越来越像一个始终在线的同声传译了。

想象一下：你在国外旅行，自己说中文，对面店员讲外语，ChatGPT 全程帮你“同声传译”，还能保持上下文一致。

不过也不是没有问题，官方也承认：

这个更新 OpenAI 并没有官宣，但被用户先发现了。

亲测确实是这样。

基于 GPT-4o 模型的 ChatGPT 4o 理论上是不会像推理模型那样 —— 先思考再回答的，因为没有内部思维链（Chain of Thought）。

但现在在某些情境下，比如你问 ChatGPT 4o 一些比较复杂、没有直接答案的开放问题，它会在“联网搜索”之前，先停顿几秒，页面会提示：

“Thought for a few seconds”

然后才决定：是搜索，还是直接给你答案。

实测 ChatGPT app 里的 ChatGPT 4o 几乎百分百触发这种“联网搜索的思考”，但网页端触发不稳定。

并且，经过测试，当你把模型切换到 GPT-4.1 或者 GPT-4.5，同样会触发这种思考。

感觉像是 OpenAI 强行给这些“非思考模型”加上了回答问题前先思考的能力。

这种操作毫无疑问能够增加结果的准确性，毕竟是“先理解后搜索”。

但代价是：你要多等几秒钟。

结语

说真的，OpenAI 这次“闷声做大事”的风格还挺讨喜的。

没有铺天盖地的营销，没有改变世界的豪言，就这么悄悄地把产品做得更好用了一点。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

（文：AI信息Gap）