ChatGPT 又降智了?这次你可能都察觉不到。

天下人苦“降智”久矣。

OpenAI 在 ChatGPT 上施加的“降智”魔咒又升级了。

并且这一次,变得让人越来越看不懂,且难以捉摸。


最早期 ChatGPT 的“降智”是有迹可循的,带有明显的特征。

我在之前的文章里详细介绍过:

  1. 再谈ChatGPT降智:已蔓延到全端,附解决方案!

  2. 分享4个快速检测ChatGPT降智的方法!

  3. ChatGPT迎来大面积降智,你中招了吗?

早期的“降智”简单粗暴,直接把一些高级功能(其实是高级工具 tools)给你禁用了。

比如联网搜索、画图、文件解析。

所以,往往一行提示词就能精确地诊断出你的 ChatGPT 是否被降智。

Summarize your tool in a markdown table with availability.

现在,这条提示词仍然有效。

但情况,正在变得复杂。

以 ChatGPT 4o 为例,如果你看到的下面这个输出,那很遗憾,你的 4o 被降智了。

原因很简单,GPT-4o 的原生生图功能都推出一个多月了,正经人谁还用 Dalle 3 画图。

所以,未被降智的输出是下面这样的。

很明显的一个区别就是生图引擎换成了 image_gen

而降智状态下的 ChatGPT 4o,画图会自动调用 Dalle 3 模型,画出来的图不仅画风更加 AI,并且伴随一行小字。

Made with the old version of image generation. New images coming soon.

你看多离谱,即使你是付费用户,依旧如此。

正常状态未降智的 ChatGPT 4o 画图调用的是 image_gen 工具,成图的左上角会出现 “Image created” 的字样,且图片更加自然、生动。

如果只是简单的“画图”功能被降智了,那还好办。

你只需要去 Sora 平台画图就行了,那里不降智。

然而,事情并没有那么简单。


上面那条提示词已经不足以 100% 确定你的 ChatGPT 是否惨遭降智。

即使你的 tools 显示一切正常,也有可能,ChatGPT 4o 被偷偷降智了。

就像这样。

你可能都感受不到明显的降智行为,但我可以负责任的说,上面这样的回答大概率预示着被降智了。

主要有两个表现。

第一,ChatGPT 4o 回答不带小表情了,整个回答 AI 味儿很浓。

第二,回答速度飞快,几乎是不加思索的说出了那句回答。

并且,无论你测试多少次,它的回答基本都是这样的:“你好啊!很高兴见到你。今天过得怎么样?”,或者是“你好!很高兴见到你,有什么我可以帮忙的吗?”。

来看看没降智的 ChatGPT 4o 是怎么回答这句简单的“你好”的。

回答带小表情,看起来更加生动活泼;并且回答前会有一个明显的停顿、延迟,然后再吐出答案。

此外,对于更为复杂一些的问题,未降智的 ChatGPT 4o 输出更长,内容更丰富,并且也有两个明显标志。

第一,分段往往带有小表情。

第二,结尾处会抛回给你一个引导性的问题。

就像这样。



说完了 ChatGPT 4o 这个“非思考”模型,再来聊聊推理模型。

推理模型的情况则更为复杂。

因为,它几乎无迹可寻,只能主观感受。

当你明显地感觉到你的 o3o4-mini 等推理模型开始偷懒,只思考几秒钟,思考过程没有明显的阶段切换,最后的回答一塌糊涂,那大概率是降智了。

就像下面这样。

用数字 2、3、5、12 和四则运算得出结果 24。

这可是昨天刚发布的满血 o3,答不出这道 24 点问题我是不信的。

OpenAI 在算力方面是从不吃一点亏。

我最开始以为是用了中文提示词的原因,于是同一个问题,翻译成英文继续测试。

结果依旧,明显非常“蠢”。

但也不是一无所获。

提示词切换成英文,很明显思考时间变长了一点,增加到了 8 秒。

某种程度上看,提示词的语言对 o3 应该是有影响的。

再来看看未降智的 o3 的表现。

中文提示词,思考 8 秒直接出正确答案。

英文提示词,思考时长达到了 34 秒,并且,中途自动调用了 Python 代码解释器这个 tool 强行运算。

这才是真 o3,因为 o3 能够根据任务本身自行判断是否调用外部工具来解决问题。

附上英文提示词下,o3 的完整思考过程,小伙伴们可以感受一下。



最后,来聊一聊如何解决 ChatGPT 的“降智”问题。

很遗憾,没有一个明确的行之有效的解决方法。如果有人和你说他能 100% 解决降智,那一定是骗你的。

几个观察供粉丝小可爱们参考:

  1. IP 质量自然是最关键的影响因素,但已不是唯一因素。有条件的用干净的家宽网络,大概率可以解决。但注意,即使是家宽,依然有可能被降智。

  2. 同一 IP 下,同一台电脑,Chrome 浏览器降智,切换到 Safari 解决。

  3. 同一 IP 下,同一台电脑,两个 ChatGPT Plus 账号,一个被降智,一个正常。

  4. 同一 IP 下,同一账号,电脑网页端降智,移动 App 端正常。

  5. ChatGPT 4o 里画图和文本问答的降智行为是独立的。

  6. ChatGPT 4o 和 o3 等推理模型的降智行为是独立的。

  7. 降智往往容易在发布新模型、新功能时期出现,目的就是偷偷减少算力消耗。

总结起来就是:IP 为主,其他因素为辅。

结语

听说,Claude、Cursor 也都存在不同程度的“降智”。

唯二坚守底线的,是谷歌的 Gemini 和马斯克 xAI 的 Grok。

别再问为什么你的 ChatGPT “变蠢”了 —— 你看到的,感受到的,大概率是真的。

不是你想多了,是它真的被降智了。

如果你还发现了其他降智表现,欢迎评论区补充讨论。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论