砸场GPT-5,马斯克:Grok 5 年底推出!

马斯克又来砸场子了!

就在OpenAI的GPT-5发布会散场之际,马斯克放出狠话:

Grok 5将在今年年底前推出,而且会「碾压性地出色」

并引用了Tech Dev Notes(@techdevnotes)的数据挑衅推文:

黑子们快出来!Grok 4 Thinking在ARC-AGI-2排行榜上的表现远超GPT-5 High!

但,这还不是最精彩的。

(也只能怪OpenAI的发布会,简直像是草台班子的车祸现场:

先是图表翻车。

在展示GPT-5在「欺骗性评估」表现的图表中,数据和柱状图完全对不上——

GPT-5明明是50.0%的欺骗率,柱子却比o3的47.4%还短:

看不清?我放大一些:

更离谱的是,在另一张图表里,o3和GPT-4o分数不同,图表里的柱子却一样高。

想知道是哪个模型这些图表……

Sam Altman 倒也是大方承认这是个「超级图表失误」,并说博客里的版本是正确的。

OpenAI的营销人员也出来道歉:「我们在博客里修正了图表,为这个无意的图表犯罪道歉。

讽刺的是,OpenAI正在吹嘘GPT-5「在减少幻觉方面取得重大进展」,结果自己先在发布会上出了最大的幻觉

也是幽默。

而更让人尴尬的,是发布会上一位员工的表现。

来,看视频:

咦,我要说什么来着?

像极了初中时第一次登上学校舞台表演唱歌的你……

手抖到腿软,紧张到忘词。

MATRX(@00MATRX)吐槽:

这太难看了,这人在台上完全是恐慌发作,他们难道连彩排都没有吗?

Ivan Zhang(@IvanZha34660145)调侃:

哈哈哈哈,这人:我接下来要说什么词来着?

而细心的网友watcherbutcher(@watcherbucher)发现了一个有趣的细节:

顺便说一句,他长得还挺像马斯克的😂

别说,还真挺像!

只是老马显然更沧桑一些。

而面对OpenAI的混乱表现,网友们的反应也是五花八门。

SerenitY(@charronj)则关心时间问题:

我们都知道特斯拉的「马斯克时间」……那xAI的「马斯克时间」是怎样的?

LW(@lmwdev)提出担忧:

希望Grok 5不只是顶级套餐专属,300美元对大多数人来说不太现实。

Norm N(@norrrm)的要求更直接:

我想要的是碾压性出色的FSD。

pestofuzz(@pestofuzz)开起了玩笑:

先出个Grok 4.20怎么样?

Ramiro Oliva(@RamiroOliva)则问到:

你觉得Grok什么时候能自主改进自己?

这场勿勿忙忙的发布会,虽然确有亮点,但在我看来就是:

交卷时间到了

毕竟,GPT-4 都两年半了。

再不交,用户和投资人都要掀桌子了,所以……

再看发布会上图表出错、员工紧张到语无伦次,也就别怪老马趁火打劫了。

只能说,确实,太草率了……




[1]

OpenAI GPT-5发布页面: https://openai.com/gpt-5/

[2]

GPT-5系统卡: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

[3]

马斯克Grok 5 推文: https://x.com/elonmusk/status/1953515379688714697

(文:AGI Hunt)

发表评论