昨天,马斯克的直播“如期”而至。
在这场迟到近 1 小时的发布会上,马斯克带着 xAI 的工程师们不仅演示了其最新模型 Grok 4
,还一如既往地“语出惊人”:
“
Grok 4
在所有学科都已达到博士(PhD)水平,甚至更好。”
这味道,怎么有种熟悉的感觉?
没错,5 个月前发布 Grok 3
时,马斯克就表达过类似的观点:“Grok 3
是地球上最聪明的 AI 模型。”
随着 Grok 4
一同发布的,还有截至目前史上最贵的 AI 套餐 SuperGrok Heavy
,定价每月 300 美元,年费则是 3000 美元,约合人民币 2.1 万元。

那么,Grok 4
凭什么,值吗?
01|两个模型:Grok 4 和 Grok 4 Heavy
这次发布,xAI 实际带来了两个版本的模型:
-
Grok 4
(标准版):单智能体架构,支持文本、图像、语音等多模态输入,拥有 256K token 上下文窗口。类似GPT-4o
或Claude Sonnet 4
,定位是“通用型 AI”。 -
Grok 4 Heavy
:多智能体协同系统(Multi-agent),由四个 AI Agent 构成,彼此协作,共享方案、交换信息后再得到答案,适用于复杂推理、工程设计、跨学科任务,被称为“AI 学习小组”。
马斯克表示,Heavy 版才是“博士后级别”的生产力模型。
此前爆料的编程专用模型 Grok 4 Code
将于今年 8 月上线,适配 Cursor,可自动修改整段代码。
02|Grok 4 真的那么强吗?
从模型参数和功能来看,Grok 4
要强于之前的爆料,比如支持多模态,以及 256K 的上下文窗口。
而从基准测试角度来看,Grok 4
跑分很硬,像是一位“考试型选手”。这一点和我之前的爆料完全一致。
“人类最后一场考试” HLE 自然是 Grok 4
最耀眼的点,接近 50% 准确率的成绩秒杀了当今 HLE 排行榜第一名 Gemini 2.5 Pro
(21.6%)。

除此之外,在其他基准测试上,如研究生水平推理测评 GPQA、竞赛级数学测评 AIME 2025,Grok 4
的表现也都可圈可点。
别的都不用看,你就看橘黄色那两个柱子,就能感到 Grok 4
相较其他模型满满的压迫感。

而更高难度的 ARC-AGI(Abstraction and Reasoning Corpus for AGI),Grok 4
则直接独占鳌头,以 15.9% 的标准成绩创下了 AI 模型新纪录。

但有一说一,尽管 Grok 4
基准测试成绩再厉害,真实能力还需要以实际体验为准。待确认。
毕竟,是骡子是马,得拉出来遛遛才知道。
03|如何使用 Grok 4?性价比如何?
目前有两种方式使用 Grok 4
。
一种是在 Grok 官网(grok.com)及手机 App;另一种是通过 API 调用。
Grok 官网的 Grok 4
模型仅对 SuperGrok
(30 美元/月,300 美元/年) 和 SuperGrok Heavy
(300 美元/月,3000 美元/年)会员开放。
当然,X 平台的 Premium+ 会员(40 美元/月,395 美元/年)仍可免费获得 SuperGrok
权限。
Grok 4 Heavy
模型仅对 SuperGrok Heavy
会员开放。
Grok 4
模型的使用次数限制为:20 次/2 小时(怎么说呢,马斯克这次有点抠了)。

和 Grok 3
API 的磨磨叽叽不同,这次 Grok 4
的 API 直接就发出来了。
多模态方面,支持文字和图片输入,文字输出。上下文窗口是 256K tokens。模型代号 grok-4-0709
。
最重要的是价格:每百万输入/输出 tokens 的价格分别为 3 美元和 15 美元。
这个定价和 Claude Sonnet 4
一致;但和 OpenAI o3
的 2 美元和 8 美元相比,性价比就要大打折扣。更不用提完全免费(有 rate limit)限制的 Gemini 2.5 Pro
了。

04|争议不断的 Grok:自由,但不能“过头”
直播发布的前一天,Grok 3
被曝在 X 平台发布反犹内容,引发热议。xAI 不得不紧急下线模型、调整系统提示词。
马斯克公开表示将“拒绝政治正确审查”,但多家媒体指出:
-
Grok 默认设定偏“媒体怀疑论”,认为主流叙事存在系统性偏见。
-
内容审核机制仍不透明,缺乏完整安全报告。
更严重的是,土耳其政府因模型输出“侮辱总统”内容已封禁 xAI Grok 服务。
这或许是 Grok 模型“最敢说”的代价。
结语
Grok 从诞生那一刻起就没有打算“安分守己”,它带着马斯克典型的“挑战一切”气质进场。
这一次,是最强、最贵、最敢说。
它是“最强 AI”?还是“最会营销 AI”?它真能打败 OpenAI、Anthropic 和谷歌吗?
现在说这些,还言之尚早。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)