马斯克又来砸场子了!

就在OpenAI的GPT-5发布会散场之际,马斯克放出狠话:
Grok 5将在今年年底前推出,而且会「碾压性地出色」。
并引用了Tech Dev Notes(@techdevnotes)的数据挑衅推文:
黑子们快出来!Grok 4 Thinking在ARC-AGI-2排行榜上的表现远超GPT-5 High!

但,这还不是最精彩的。
(也只能怪OpenAI的发布会,简直像是草台班子的车祸现场:
先是图表翻车。
在展示GPT-5在「欺骗性评估」表现的图表中,数据和柱状图完全对不上——
GPT-5明明是50.0%的欺骗率,柱子却比o3的47.4%还短:

看不清?我放大一些:

更离谱的是,在另一张图表里,o3和GPT-4o分数不同,图表里的柱子却一样高。

想知道是哪个模型这些图表……
Sam Altman 倒也是大方承认这是个「超级图表失误」,并说博客里的版本是正确的。

OpenAI的营销人员也出来道歉:「我们在博客里修正了图表,为这个无意的图表犯罪道歉。」

讽刺的是,OpenAI正在吹嘘GPT-5「在减少幻觉方面取得重大进展」,结果自己先在发布会上出了最大的幻觉。
也是幽默。
而更让人尴尬的,是发布会上一位员工的表现。
来,看视频:
像极了初中时第一次登上学校舞台表演唱歌的你……
手抖到腿软,紧张到忘词。
MATRX(@00MATRX)吐槽:
这太难看了,这人在台上完全是恐慌发作,他们难道连彩排都没有吗?

Ivan Zhang(@IvanZha34660145)调侃:
哈哈哈哈,这人:我接下来要说什么词来着?

而细心的网友watcherbutcher(@watcherbucher)发现了一个有趣的细节:
顺便说一句,他长得还挺像马斯克的😂
别说,还真挺像!

只是老马显然更沧桑一些。
而面对OpenAI的混乱表现,网友们的反应也是五花八门。

SerenitY(@charronj)则关心时间问题:
我们都知道特斯拉的「马斯克时间」……那xAI的「马斯克时间」是怎样的?
LW(@lmwdev)提出担忧:
希望Grok 5不只是顶级套餐专属,300美元对大多数人来说不太现实。
Norm N(@norrrm)的要求更直接:
我想要的是碾压性出色的FSD。

pestofuzz(@pestofuzz)开起了玩笑:
先出个Grok 4.20怎么样?
Ramiro Oliva(@RamiroOliva)则问到:
你觉得Grok什么时候能自主改进自己?
这场勿勿忙忙的发布会,虽然确有亮点,但在我看来就是:
交卷时间到了。
毕竟,GPT-4 都两年半了。
再不交,用户和投资人都要掀桌子了,所以……
再看发布会上图表出错、员工紧张到语无伦次,也就别怪老马趁火打劫了。

只能说,确实,太草率了……
OpenAI GPT-5发布页面: https://openai.com/gpt-5/
[2]GPT-5系统卡: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf
[3]马斯克Grok 5 推文: https://x.com/elonmusk/status/1953515379688714697
(文:AGI Hunt)