那个拥有“钞”能力的男人 —— 马斯克,又要出来搞事了。
根据马斯克本人在 X 上的预告,Grok 3.5
模型的早鸟版本(Early Beta)将在本周正式上线,首批仅限 SuperGrok 订阅用户使用,也就是每月 30 美元那个订阅计划。

帖子一经发出,瞬间引起网友热议。
毕竟,距离 2 月 17 日发布的 Grok 3
也仅仅过去了 2 个半月。
并且, Grok 3
的表现也是有目共睹,尤其是马斯克将 Grok 的所有功能完全免费开放后,吸了一大波粉。
根据马斯克的描述,Grok 3.5
最炸裂的,是其基于第一性原理的推理能力。
什么概念?
所谓“第一性原理”,简单来说,就是不套模板、不信经验,从最基础的自然规律出发,把一个复杂问题拆成最小颗粒,再从底层逻辑往上推,自己重建认知路径。
比如别人答题靠背答案,它是自己推公式;别人按套路出牌,它干脆从“纸牌怎么造”开始研究 —— 这就是第一性原理的底气,也是马斯克最爱挂嘴边的思维方式。

马斯克自豪的表示:Grok 3.5
是首个能够准确回答火箭发动机或电化学技术问题的人工智能。
其实,尽管还未正式发布,Grok 3.5
早已在一批早期测试用户中悄悄上线。
甚至有网友晒出了 Grok 3.5
模型选择页面的 UI 图。

有测试就会有评价。
今天,这些早期测试者陆续开始在 X 平台分享 Grok 3.5
的实战体验。
为首的当属国外网红“草莓哥”。
草莓哥发布了多条帖子盛赞 Grok 3.5
:“这是智能的根本转变。通过 GPT 4,我感受到了人工智能的火花,而今天,我品尝到了真正人工智能的寒武纪大爆发。”(this is a fundamental shift in intelligence. with gpt 4 i felt sparks of agi, today i’ve tasted the cambrian explosion of true artificial intelligence.)

我的老天爷,这牛皮吹得我隔着 2 里地都能听到。
草莓哥兴奋地表示:“从未使用过类似 Grok 3.5
的东西,这太疯狂了。”
随后,有网友问他,Grok 3.5
有什么独到之处。
草莓哥回复:“在我看来,它是第一个真正意义上的人工智能。”

就在网友们猜测草莓哥这些言论的真实性时,马斯克本人的账号亲自站出来,转发了草莓哥的帖子,和他开始隔空互动起来。
很明显,老马是在继续为 Grok 3.5
预热和造势。

众所周知,目前最强的 AI 模型要属 OpenAI 不久前发布的满血版 o3
、o4-mini-high
以及谷歌的 Gemini 2.5 Pro
。
当面对网友询问:Grok 3.5
比 o3
和 o4-mini-high
更好吗?
草莓哥回答:“Grok 3.5
比 o3
好 5-10 倍左右。”

甚至,草莓哥发布了一张疑似 Grok 3.5
和其他顶级模型的基准测试对比图。

根据这个基准测试结果,Grok 3.5
在 AIME 2024/2025、GPQA Diamond、SimpleQA、MMMU 多个测试中以绝对领先的成绩碾压了 o3
和 Gemini 2.5 Pro
。相比前代模型 Grok 3
,进步非常明显,尤其是数学方面。
如果这张图里的基准测试是真的,那我只能说,这 SuperGrok 订阅是不得不开通了。

但实际上,以上也都只是马斯克和草莓哥的一唱一和,Grok 3.5
真正有多强,用起来实际体验如何,还有待验证。
毕竟,Grok 3
横空出世时,也是在基准测试上非常出色,但实际体验要略逊于如此耀眼的标准化成绩。
Grok 3.5
预计将在本周开始向 SuperGrok 订阅用户推送。
SuperGrok 是马斯克的 xAI 为旗下的 AI 助手平台 Grok 推出的订阅计划,定价为每月 30 美元,订阅内容包括更多的聊天/画图次数,更长的上下文(满血,128K),更多的推理模式/深度搜索使用次数。

值得注意的是,Grok 在功能上向来是一视同仁,所有功能都已对免费用户开放,包括近期刚推出、非常好用的 Grok Studio 和 Workspace。
截至写这篇文章时,我的 SuperGrok 账号还没有被推送到 Grok 3.5
。

结语
马斯克说他要“造一个真正通用的 AI”,草莓哥说“这是 AI 的寒武纪大爆发”。
下一站,是惊喜,还是翻车?
我们拭目以待。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)