Claude 4 要来了!

配置文件暴露了Claude 4 的痕迹!

AI(八卦)技术专家Tibor Blaho(@btibor91)在Anthropic的前端配置中发现了令人震惊的线索:

「Claude Sonnet 4」和「Claude Opus 4」 赫然出现在系统中,页面显示着「Try Claude Sonnet 4 or Claude Opus 4 for Anthropic’s smartest models yet」的字样。

而有意思的是,这些模型标注着 「Not intended for production use. Subject to strict rate limits」,说明Anthropic正在内部测试这些新模型。

配置文件中还出现了神秘的 「show_raw_thinking」 和 「show_raw_thinking_mechanism」 功能,暗示Claude 4可能具备让用户查看AI思考过程的能力。

配置文件出处:https://archive.is/f1ibF

竞争对手环顾

OpenAI的o3系列已经放大招了。

见:o3来了,非常出色!

这个被定位为「最强推理模型」的家伙,首次给ChatGPT配备了完全自主的多工具调用能力,能在一次对话中串联搜索、Python、文件分析和制图。

更变态的是,o4-mini在AIME 2025竞赛数学测试中达到了99.5%的通过率

Google DeepMind 更是不甘示弱。

见:Gemini 2.5 Pro强势更新并霸榜,Claude 3.7首次遭遇全方位碾压!

刚刚发布的Gemini 2.5 Pro带来了三大杀手锏:Deep Think模式能进行多假设并行推演,Thought summaries向开发者开放模型「思考提要」,还有原生音频输出让AI直接「开口说话」。

连“后起新秀”马斯克的xAI都想要搞大事情。

见:马斯克:Grok 3.5 下周发布!能用第一性原理给出互联网上不存在的答案

据马斯克透露,Grok 3.5 号称通过「第一性原理思考」能回答火箭发动机、材料电化学等互联网上找不到现成答案的问题。

泄露的基准测试显示,Grok 3.5在AIME 24/25、GPQA等测试中全面压过上一代,逼近甚至超越部分闭源顶级模型。

Claude 4 的巨大压力

从各个角度看,Claude 4都承受着前所未有的竞争压力。

技术维度上,它必须在推理深度、工具生态、透明可解释性方面至少对标o3和Gemini 2.5 Pro。那个神秘的「show_raw_thinking」功能如果真能让用户看到AI的完整思考过程,而不仅仅是摘要,将成为同类产品中的独占卖点。

商业定位上,Anthropic很可能延续「Haiku → Sonnet → Opus」的三档策略,但Sonnet 4和Opus 4在正式发布前会以限流或付费高阶套餐的形式进行小范围测试。

市场时机上,如果Claude 4无法在推理深度或时效性上取得质的提升,就难以摆脱「学术基准赢,真实场景弱」的刻板印象。

重压之下,Claude 要么成为粉末,要么成为钻石。

网友期待拉满

社区对Claude 4的期待值已经拉满了。

SystemSculpt(@SystemSculpt)关心API访问权限:「他们不可能不提供API访问吧?看来是周四发布!

Curious Curiousiter(@curiousiter)直接兴奋了:「冲啊!!Opus肯定会很疯狂

但也有泼冷水的。Josip Tomo Licardo(@jtlicardo)毫不客气地说:「自从3.5 Sonnet之后,他们就没发布过好模型

Timur Khakhalev(@timurkhakhalev)更是直接押注:「我赌100美元,这玩意只会在MAX套餐里提供,而且只对巴西和美国开放。对Anthropic已经没兴趣了

不过大部分人还是很期待的。

Josh(@Josh9817)表态:「我不在乎Google有没有AGI级别的模型,给我Opus 4就行

Claude 4的破局机会

面对OpenAI、Google、xAI的围攻,Anthropic并非毫无胜算。

可解释性可能是最大的突破口。

如果「show_raw_thinking」真能让开发者完整观察模型思考,而不仅是静态摘要,这或许是个极有吸引力的功能。

安全与合规品牌也是Anthropic的传统强项。

在监管愈发严格的2025年,他们的Constitutional AI和安全对齐技术栈可能成为大客户续签的决定性因素。

另外,长上下文处理如果能配合法律、金融等垂直领域的强化,延续Claude 3在合规场景的口碑,主攻对文字准确率要求极高的客户群体。

现在的问题是:Claude 4真的能在这场没有终点的AI竞赛中杀出重围吗?

按照业界普遍预测,Anthropic很可能在5月22日的「Code with Claude」活动上正式公布Claude 4。

如果它真的让「思考」变得可观察、可调度,或许又会开启下一轮AI能力的军备竞赛。

竞争的循环永无止境。 

每个月,几乎都会有至少一款全新的 全球最强大表款 登上桂冠。

人们鼓掌、比较,然后等待下一个。

这是一场没有终点线的比赛!

下一个,会是Anthropic 的Claude 4 吗?

你怎么看?

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往