马斯克 Grok 4 来了！史上最强、最贵、最敢说 AI？土耳其：已封杀！

昨天，马斯克的直播“如期”而至。

在这场迟到近 1 小时的发布会上，马斯克带着 xAI 的工程师们不仅演示了其最新模型 Grok 4，还一如既往地“语出惊人”：

“Grok 4 在所有学科都已达到博士（PhD）水平，甚至更好。”

这味道，怎么有种熟悉的感觉？

没错，5 个月前发布 Grok 3 时，马斯克就表达过类似的观点：“Grok 3 是地球上最聪明的 AI 模型。”

随着 Grok 4 一同发布的，还有截至目前史上最贵的 AI 套餐 SuperGrok Heavy，定价每月 300 美元，年费则是 3000 美元，约合人民币 2.1 万元。

那么，Grok 4 凭什么，值吗？

01｜两个模型：Grok 4 和 Grok 4 Heavy

这次发布，xAI 实际带来了两个版本的模型：

Grok 4（标准版）：单智能体架构，支持文本、图像、语音等多模态输入，拥有 256K token 上下文窗口。类似 GPT-4o 或 Claude Sonnet 4，定位是“通用型 AI”。
Grok 4 Heavy：多智能体协同系统（Multi-agent），由四个 AI Agent 构成，彼此协作，共享方案、交换信息后再得到答案，适用于复杂推理、工程设计、跨学科任务，被称为“AI 学习小组”。

马斯克表示，Heavy 版才是“博士后级别”的生产力模型。

此前爆料的编程专用模型 Grok 4 Code 将于今年 8 月上线，适配 Cursor，可自动修改整段代码。

02｜Grok 4 真的那么强吗？

从模型参数和功能来看，Grok 4 要强于之前的爆料，比如支持多模态，以及 256K 的上下文窗口。

而从基准测试角度来看，Grok 4 跑分很硬，像是一位“考试型选手”。这一点和我之前的爆料完全一致。

“人类最后一场考试” HLE 自然是 Grok 4 最耀眼的点，接近 50% 准确率的成绩秒杀了当今 HLE 排行榜第一名 Gemini 2.5 Pro（21.6%）。

除此之外，在其他基准测试上，如研究生水平推理测评 GPQA、竞赛级数学测评 AIME 2025，Grok 4 的表现也都可圈可点。

别的都不用看，你就看橘黄色那两个柱子，就能感到 Grok 4 相较其他模型满满的压迫感。

而更高难度的 ARC-AGI（Abstraction and Reasoning Corpus for AGI），Grok 4 则直接独占鳌头，以 15.9% 的标准成绩创下了 AI 模型新纪录。

但有一说一，尽管 Grok 4 基准测试成绩再厉害，真实能力还需要以实际体验为准。待确认。

毕竟，是骡子是马，得拉出来遛遛才知道。

03｜如何使用 Grok 4？性价比如何？

目前有两种方式使用 Grok 4。

一种是在 Grok 官网（grok.com）及手机 App；另一种是通过 API 调用。

Grok 官网的 Grok 4 模型仅对 SuperGrok（30 美元/月，300 美元/年）和 SuperGrok Heavy（300 美元/月，3000 美元/年）会员开放。

当然，X 平台的 Premium+ 会员（40 美元/月，395 美元/年）仍可免费获得 SuperGrok 权限。

Grok 4 Heavy 模型仅对 SuperGrok Heavy 会员开放。

Grok 4 模型的使用次数限制为：20 次/2 小时（怎么说呢，马斯克这次有点抠了）。

和 Grok 3 API 的磨磨叽叽不同，这次 Grok 4 的 API 直接就发出来了。

多模态方面，支持文字和图片输入，文字输出。上下文窗口是 256K tokens。模型代号 grok-4-0709。

最重要的是价格：每百万输入/输出 tokens 的价格分别为 3 美元和 15 美元。

这个定价和 Claude Sonnet 4 一致；但和 OpenAI o3 的 2 美元和 8 美元相比，性价比就要大打折扣。更不用提完全免费（有 rate limit）限制的 Gemini 2.5 Pro 了。

04｜争议不断的 Grok：自由，但不能“过头”

直播发布的前一天，Grok 3 被曝在 X 平台发布反犹内容，引发热议。xAI 不得不紧急下线模型、调整系统提示词。

马斯克公开表示将“拒绝政治正确审查”，但多家媒体指出：

Grok 默认设定偏“媒体怀疑论”，认为主流叙事存在系统性偏见。
内容审核机制仍不透明，缺乏完整安全报告。

更严重的是，土耳其政府因模型输出“侮辱总统”内容已封禁 xAI Grok 服务。

这或许是 Grok 模型“最敢说”的代价。

结语

Grok 从诞生那一刻起就没有打算“安分守己”，它带着马斯克典型的“挑战一切”气质进场。

这一次，是最强、最贵、最敢说。

它是“最强 AI”？还是“最会营销 AI”？它真能打败 OpenAI、Anthropic 和谷歌吗？

现在说这些，还言之尚早。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

（文：AI信息Gap）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

01｜两个模型：Grok 4 和 Grok 4 Heavy

02｜Grok 4 真的那么强吗？

03｜如何使用 Grok 4？性价比如何？

04｜争议不断的 Grok：自由，但不能“过头”

结语

发表评论 取消回复

发表评论取消回复