语音更像真人、搜索前先思考?ChatGPT 这波悄悄升级挺有料

刚刚过去的周末(具体来说是 6 月 8 日),OpenAI 又悄悄扔了两个小炸弹:

一个是 高级语音模式(Advanced Voice Mode)升级,一个是 ChatGPT 4o引入“先思考再搜索”机制

两个更新都挺有料的,重点是 —— OpenAI 没搞大新闻、没搞直播发布会,就这么静悄悄地推送给了 ChatGPT 全体付费用户。

尤其是语音模式的升级,感觉终于开始往“有灵魂的语音助手”靠近了。



01|高级语音模式:它,更像“人”了

先说结论:这波语音升级,是真能打的。

虽然之前的 AI 语音功能已经很强,看上去有模有样,但一说话还是避免不了些许“AI感” —— 语气太平、情绪假、节奏奇怪。

这次更新之后,语音、语调和情绪的自然度明显提升。

它开始会:

  • 停顿;
  • 重音;
  • 偶尔拉长音调表达同理;
  • 甚至试图“皮一下”来表达讽刺和幽默。

虽然还做不到 100% 自然,但已经很逼近“配音演员式”对话体验了。

尤其是在处理“带点情绪”的语句时,已经不像以前那样一板一眼。

而且这次还有个特别实用的新功能:持续翻译

之前的翻译需要一轮一轮触发,现在,你只要和它说一句“请帮我翻译”,它就会进入翻译模式,接下来的所有对话,它都会自动双向翻译,直到你告诉它“停止翻译”。

越来越像一个始终在线的同声传译了。

想象一下:你在国外旅行,自己说中文,对面店员讲外语,ChatGPT 全程帮你“同声传译”,还能保持上下文一致。

不过也不是没有问题,官方也承认:

  • 有时语音输出会出现奇怪的音调波动;
  • 极少数情况下,语音模式会产生幻觉,比如突然蹦出像广告、背景音之类的杂音。


02|ChatGPT 4o:现在它会“想一会儿”,再去联网搜索

这个更新 OpenAI 并没有官宣,但被用户先发现了。

亲测确实是这样。

基于 GPT-4o 模型的 ChatGPT 4o 理论上是不会像推理模型那样 —— 先思考再回答的,因为没有内部思维链(Chain of Thought)。

但现在在某些情境下,比如你问 ChatGPT 4o 一些比较复杂、没有直接答案的开放问题,它会在“联网搜索”之前,先停顿几秒,页面会提示:

“Thought for a few seconds”

然后才决定:是搜索,还是直接给你答案。

实测 ChatGPT app 里的 ChatGPT 4o 几乎百分百触发这种“联网搜索的思考”,但网页端触发不稳定。

并且,经过测试,当你把模型切换到 GPT-4.1 或者 GPT-4.5,同样会触发这种思考。

感觉像是 OpenAI 强行给这些“非思考模型”加上了回答问题前先思考的能力。

这种操作毫无疑问能够增加结果的准确性,毕竟是“先理解后搜索”。

但代价是:你要多等几秒钟。



结语

说真的,OpenAI 这次“闷声做大事”的风格还挺讨喜的。

没有铺天盖地的营销,没有改变世界的豪言,就这么悄悄地把产品做得更好用了一点。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往