天下人苦“降智”久矣。
OpenAI 在 ChatGPT 上施加的“降智”魔咒又升级了。
并且这一次,变得让人越来越看不懂,且难以捉摸。
最早期 ChatGPT 的“降智”是有迹可循的,带有明显的特征。
我在之前的文章里详细介绍过:
-
再谈ChatGPT降智:已蔓延到全端,附解决方案!
-
分享4个快速检测ChatGPT降智的方法!
-
ChatGPT迎来大面积降智,你中招了吗?
早期的“降智”简单粗暴,直接把一些高级功能(其实是高级工具 tools)给你禁用了。
比如联网搜索、画图、文件解析。
所以,往往一行提示词就能精确地诊断出你的 ChatGPT 是否被降智。
Summarize your tool in a markdown table with availability.
现在,这条提示词仍然有效。
但情况,正在变得复杂。
以 ChatGPT 4o
为例,如果你看到的下面这个输出,那很遗憾,你的 4o
被降智了。

原因很简单,GPT-4o
的原生生图功能都推出一个多月了,正经人谁还用 Dalle 3
画图。
所以,未被降智的输出是下面这样的。
很明显的一个区别就是生图引擎换成了 image_gen
。

而降智状态下的 ChatGPT 4o
,画图会自动调用 Dalle 3
模型,画出来的图不仅画风更加 AI,并且伴随一行小字。
Made with the old version of image generation. New images coming soon.
你看多离谱,即使你是付费用户,依旧如此。

正常状态未降智的 ChatGPT 4o
画图调用的是 image_gen
工具,成图的左上角会出现 “Image created” 的字样,且图片更加自然、生动。

如果只是简单的“画图”功能被降智了,那还好办。
你只需要去 Sora 平台画图就行了,那里不降智。
然而,事情并没有那么简单。
上面那条提示词已经不足以 100% 确定你的 ChatGPT 是否惨遭降智。
即使你的 tools 显示一切正常,也有可能,ChatGPT 4o
被偷偷降智了。
就像这样。

你可能都感受不到明显的降智行为,但我可以负责任的说,上面这样的回答大概率预示着被降智了。
主要有两个表现。
第一,ChatGPT 4o
回答不带小表情了,整个回答 AI 味儿很浓。
第二,回答速度飞快,几乎是不加思索的说出了那句回答。
并且,无论你测试多少次,它的回答基本都是这样的:“你好啊!很高兴见到你。今天过得怎么样?”,或者是“你好!很高兴见到你,有什么我可以帮忙的吗?”。
来看看没降智的 ChatGPT 4o
是怎么回答这句简单的“你好”的。
回答带小表情,看起来更加生动活泼;并且回答前会有一个明显的停顿、延迟,然后再吐出答案。

此外,对于更为复杂一些的问题,未降智的 ChatGPT 4o
输出更长,内容更丰富,并且也有两个明显标志。
第一,分段往往带有小表情。
第二,结尾处会抛回给你一个引导性的问题。
就像这样。

说完了 ChatGPT 4o
这个“非思考”模型,再来聊聊推理模型。
推理模型的情况则更为复杂。
因为,它几乎无迹可寻,只能主观感受。
当你明显地感觉到你的 o3
、o4-mini
等推理模型开始偷懒,只思考几秒钟,思考过程没有明显的阶段切换,最后的回答一塌糊涂,那大概率是降智了。
就像下面这样。
用数字 2、3、5、12 和四则运算得出结果 24。

这可是昨天刚发布的满血 o3
,答不出这道 24 点问题我是不信的。
OpenAI 在算力方面是从不吃一点亏。
我最开始以为是用了中文提示词的原因,于是同一个问题,翻译成英文继续测试。
结果依旧,明显非常“蠢”。

但也不是一无所获。
提示词切换成英文,很明显思考时间变长了一点,增加到了 8 秒。
某种程度上看,提示词的语言对 o3
应该是有影响的。
再来看看未降智的 o3
的表现。
中文提示词,思考 8 秒直接出正确答案。

英文提示词,思考时长达到了 34 秒,并且,中途自动调用了 Python 代码解释器这个 tool 强行运算。
这才是真 o3
,因为 o3
能够根据任务本身自行判断是否调用外部工具来解决问题。

附上英文提示词下,o3
的完整思考过程,小伙伴们可以感受一下。

最后,来聊一聊如何解决 ChatGPT 的“降智”问题。
很遗憾,没有一个明确的行之有效的解决方法。如果有人和你说他能 100% 解决降智,那一定是骗你的。
几个观察供粉丝小可爱们参考:
-
IP 质量自然是最关键的影响因素,但已不是唯一因素。有条件的用干净的家宽网络,大概率可以解决。但注意,即使是家宽,依然有可能被降智。
-
同一 IP 下,同一台电脑,Chrome 浏览器降智,切换到 Safari 解决。
-
同一 IP 下,同一台电脑,两个 ChatGPT Plus 账号,一个被降智,一个正常。
-
同一 IP 下,同一账号,电脑网页端降智,移动 App 端正常。
-
ChatGPT 4o
里画图和文本问答的降智行为是独立的。 -
ChatGPT 4o
和o3
等推理模型的降智行为是独立的。 -
降智往往容易在发布新模型、新功能时期出现,目的就是偷偷减少算力消耗。
总结起来就是:IP 为主,其他因素为辅。
结语
听说,Claude、Cursor 也都存在不同程度的“降智”。
唯二坚守底线的,是谷歌的 Gemini 和马斯克 xAI 的 Grok。
别再问为什么你的 ChatGPT “变蠢”了 —— 你看到的,感受到的,大概率是真的。
不是你想多了,是它真的被降智了。
如果你还发现了其他降智表现,欢迎评论区补充讨论。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)