马斯克 Grok 4 来了!史上最强、最贵、最敢说 AI?土耳其:已封杀!

昨天,马斯克的直播“如期”而至。

在这场迟到近 1 小时的发布会上,马斯克带着 xAI 的工程师们不仅演示了其最新模型 Grok 4,还一如既往地“语出惊人”:

Grok 4 在所有学科都已达到博士(PhD)水平,甚至更好。”

这味道,怎么有种熟悉的感觉?

没错,5 个月前发布 Grok 3 时,马斯克就表达过类似的观点:“Grok 3 是地球上最聪明的 AI 模型。”

随着 Grok 4 一同发布的,还有截至目前史上最贵的 AI 套餐 SuperGrok Heavy,定价每月 300 美元,年费则是 3000 美元,约合人民币 2.1 万元。

那么,Grok 4 凭什么,值吗?



01|两个模型:Grok 4 和 Grok 4 Heavy

这次发布,xAI 实际带来了两个版本的模型:

  • Grok 4(标准版):单智能体架构,支持文本、图像、语音等多模态输入,拥有 256K token 上下文窗口。类似 GPT-4o 或 Claude Sonnet 4,定位是“通用型 AI”。
  • Grok 4 Heavy:多智能体协同系统(Multi-agent),由四个 AI Agent 构成,彼此协作,共享方案、交换信息后再得到答案,适用于复杂推理、工程设计、跨学科任务,被称为“AI 学习小组”。

马斯克表示,Heavy 版才是“博士后级别”的生产力模型。

此前爆料的编程专用模型 Grok 4 Code 将于今年 8 月上线,适配 Cursor,可自动修改整段代码。



02|Grok 4 真的那么强吗?

从模型参数和功能来看,Grok 4 要强于之前的爆料,比如支持多模态,以及 256K 的上下文窗口。

而从基准测试角度来看,Grok 4 跑分很硬,像是一位“考试型选手”。这一点和我之前的爆料完全一致。

“人类最后一场考试” HLE 自然是 Grok 4 最耀眼的点,接近 50% 准确率的成绩秒杀了当今 HLE 排行榜第一名 Gemini 2.5 Pro(21.6%)。

除此之外,在其他基准测试上,如研究生水平推理测评 GPQA、竞赛级数学测评 AIME 2025,Grok 4 的表现也都可圈可点。

别的都不用看,你就看橘黄色那两个柱子,就能感到 Grok 4 相较其他模型满满的压迫感。

而更高难度的 ARC-AGI(Abstraction and Reasoning Corpus for AGI),Grok 4 则直接独占鳌头,以 15.9% 的标准成绩创下了 AI 模型新纪录。

但有一说一,尽管 Grok 4 基准测试成绩再厉害,真实能力还需要以实际体验为准。待确认。

毕竟,是骡子是马,得拉出来遛遛才知道。



03|如何使用 Grok 4?性价比如何?

目前有两种方式使用 Grok 4

一种是在 Grok 官网(grok.com)及手机 App;另一种是通过 API 调用。

Grok 官网的 Grok 4 模型仅对 SuperGrok(30 美元/月,300 美元/年) 和 SuperGrok Heavy(300 美元/月,3000 美元/年)会员开放。

当然,X 平台的 Premium+ 会员(40 美元/月,395 美元/年)仍可免费获得 SuperGrok 权限。

Grok 4 Heavy 模型仅对 SuperGrok Heavy 会员开放。

Grok 4 模型的使用次数限制为:20 次/2 小时(怎么说呢,马斯克这次有点抠了)。

和 Grok 3 API 的磨磨叽叽不同,这次 Grok 4 的 API 直接就发出来了。

多模态方面,支持文字和图片输入,文字输出。上下文窗口是 256K tokens。模型代号 grok-4-0709

最重要的是价格:每百万输入/输出 tokens 的价格分别为 3 美元和 15 美元。

这个定价和 Claude Sonnet 4 一致;但和 OpenAI o3 的 2 美元和 8 美元相比,性价比就要大打折扣。更不用提完全免费(有 rate limit)限制的 Gemini 2.5 Pro 了。



04|争议不断的 Grok:自由,但不能“过头”

直播发布的前一天,Grok 3 被曝在 X 平台发布反犹内容,引发热议。xAI 不得不紧急下线模型、调整系统提示词。

马斯克公开表示将“拒绝政治正确审查”,但多家媒体指出:

  • Grok 默认设定偏“媒体怀疑论”,认为主流叙事存在系统性偏见。

  • 内容审核机制仍不透明,缺乏完整安全报告。

更严重的是,土耳其政府因模型输出“侮辱总统”内容已封禁 xAI Grok 服务。

这或许是 Grok 模型“最敢说”的代价。



结语

Grok 从诞生那一刻起就没有打算“安分守己”,它带着马斯克典型的“挑战一切”气质进场。

这一次,是最强、最贵、最敢说。

它是“最强 AI”?还是“最会营销 AI”?它真能打败 OpenAI、Anthropic 和谷歌吗?

现在说这些,还言之尚早。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论