Claude 4 要来了！

配置文件暴露了Claude 4 的痕迹！

AI（八卦）技术专家Tibor Blaho(@btibor91)在Anthropic的前端配置中发现了令人震惊的线索：

「Claude Sonnet 4」和「Claude Opus 4」 赫然出现在系统中，页面显示着「Try Claude Sonnet 4 or Claude Opus 4 for Anthropic’s smartest models yet」的字样。

而有意思的是，这些模型标注着 「Not intended for production use. Subject to strict rate limits」，说明Anthropic正在内部测试这些新模型。

配置文件中还出现了神秘的 「show_raw_thinking」 和 「show_raw_thinking_mechanism」 功能，暗示Claude 4可能具备让用户查看AI思考过程的能力。

配置文件出处：https://archive.is/f1ibF

竞争对手环顾

OpenAI的o3系列已经放大招了。

见：o3来了，非常出色！

这个被定位为「最强推理模型」的家伙，首次给ChatGPT配备了完全自主的多工具调用能力，能在一次对话中串联搜索、Python、文件分析和制图。

更变态的是，o4-mini在AIME 2025竞赛数学测试中达到了99.5%的通过率。

Google DeepMind 更是不甘示弱。

见：Gemini 2.5 Pro强势更新并霸榜，Claude 3.7首次遭遇全方位碾压！

刚刚发布的Gemini 2.5 Pro带来了三大杀手锏：Deep Think模式能进行多假设并行推演，Thought summaries向开发者开放模型「思考提要」，还有原生音频输出让AI直接「开口说话」。

连“后起新秀”马斯克的xAI都想要搞大事情。

见：马斯克：Grok 3.5 下周发布！能用第一性原理给出互联网上不存在的答案

据马斯克透露，Grok 3.5 号称通过「第一性原理思考」能回答火箭发动机、材料电化学等互联网上找不到现成答案的问题。

泄露的基准测试显示，Grok 3.5在AIME 24/25、GPQA等测试中全面压过上一代，逼近甚至超越部分闭源顶级模型。

Claude 4 的巨大压力

从各个角度看，Claude 4都承受着前所未有的竞争压力。

技术维度上，它必须在推理深度、工具生态、透明可解释性方面至少对标o3和Gemini 2.5 Pro。那个神秘的「show_raw_thinking」功能如果真能让用户看到AI的完整思考过程，而不仅仅是摘要，将成为同类产品中的独占卖点。

商业定位上，Anthropic很可能延续「Haiku → Sonnet → Opus」的三档策略，但Sonnet 4和Opus 4在正式发布前会以限流或付费高阶套餐的形式进行小范围测试。

市场时机上，如果Claude 4无法在推理深度或时效性上取得质的提升，就难以摆脱「学术基准赢，真实场景弱」的刻板印象。

重压之下，Claude 要么成为粉末，要么成为钻石。

网友期待拉满

社区对Claude 4的期待值已经拉满了。

SystemSculpt(@SystemSculpt)关心API访问权限：「他们不可能不提供API访问吧？看来是周四发布！」

Curious Curiousiter(@curiousiter)直接兴奋了：「冲啊！！Opus肯定会很疯狂」

但也有泼冷水的。Josip Tomo Licardo(@jtlicardo)毫不客气地说：「自从3.5 Sonnet之后，他们就没发布过好模型」

Timur Khakhalev(@timurkhakhalev)更是直接押注：「我赌100美元，这玩意只会在MAX套餐里提供，而且只对巴西和美国开放。对Anthropic已经没兴趣了」

不过大部分人还是很期待的。

Josh(@Josh9817)表态：「我不在乎Google有没有AGI级别的模型，给我Opus 4就行」

Claude 4的破局机会

面对OpenAI、Google、xAI的围攻，Anthropic并非毫无胜算。

可解释性可能是最大的突破口。

如果「show_raw_thinking」真能让开发者完整观察模型思考，而不仅是静态摘要，这或许是个极有吸引力的功能。

安全与合规品牌也是Anthropic的传统强项。

在监管愈发严格的2025年，他们的Constitutional AI和安全对齐技术栈可能成为大客户续签的决定性因素。

另外，长上下文处理如果能配合法律、金融等垂直领域的强化，延续Claude 3在合规场景的口碑，主攻对文字准确率要求极高的客户群体。

现在的问题是：Claude 4真的能在这场没有终点的AI竞赛中杀出重围吗？

按照业界普遍预测，Anthropic很可能在5月22日的「Code with Claude」活动上正式公布Claude 4。

如果它真的让「思考」变得可观察、可调度，或许又会开启下一轮AI能力的军备竞赛。

竞争的循环永无止境。

每个月，几乎都会有至少一款全新的 “全球最强大表款” 登上桂冠。

人们鼓掌、比较，然后等待下一个。

这是一场没有终点线的比赛！

下一个，会是Anthropic 的Claude 4 吗？

你怎么看？

（文：AGI Hunt）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

竞争对手环顾

Claude 4 的巨大压力

网友期待拉满

Claude 4的破局机会

发表评论 取消回复

发表评论取消回复