DeepSeek-R2 推迟发布？一场关于性能、芯片与时机的博弈

最近关于 DeepSeek-R2 的讨论很热。

我翻了一下，最初的信息源应该是科技媒体 The Information 于 6 月 26 日发表的一篇题为《DeepSeek’s Progress Stalled by U.S. Export Controls》的文章，其中指出 DeepSeek 内部的 R2 模型开发遇到了两个关键瓶颈：一是 CEO 梁文锋对模型当前性能不满意，拒绝批准发布；二是受限于美国政府对 NVIDIA H20 芯片的新一轮出口管制，算力短缺正实质性阻碍新模型的训练与部署。

文章还提到，R2 原定于 2025 年 5 月初发布，如今已经默默跳票超过 50 天，DeepSeek 团队正尝试通过国产算力替代和模型结构优化来“重新构建发布条件”。

这条消息一出，路透社、The Tech Basic、NewsBytes，以及国内的 IT 之家、新浪财经，都迅速跟进了相关报道。

那么，究竟是哪里出了问题？R2 为何迟迟不上线？这场沉默背后，隐藏着两个现实：性能没达标，芯片没到位。

01｜R2 “难产”全过程

2025年2月，路透社首度披露 DeepSeek 计划“最迟 5 月初”发布 R2；
2025年3月，R2 发布传闻流传于 X 平台，DeepSeek 官方客服账号在用户群中澄清“为假消息”；
2025年5月，原定时间节点已过，DeepSeek 并无正式动作，技术社区开始出现猜测；
2025年6月26日，The Information 首次披露 CEO 梁文锋对 R2 性能不满，决定暂缓上线；
次日，包括路透社、IT 之家、新浪财经等媒体接连跟进报道，确认延期为“实际状态”。

02｜第一条主线：性能没过关

DeepSeek-R2 原本承载了“国产开源模型压制国外闭源模型”的野心。

根据之前的爆料，其核心规格包括（传闻，未证实）：

总参数量：1.2 万亿，采用 Hybrid MoE 架构；
动态激活参数：780 亿；
单 token 推理成本下降 97.3%；
主打方向：编程能力、多语言推理、多模态能力。

如果是真的，那 R2 就“无敌”了。但可能正因为“目标太高”，反而卡在了最后一公里。

据 The Tech Basic 报道，R2 在内部基准测试中始终无法实现对 R1 的全面碾压，尤其在多语言、编程等关键能力上“提升有限”。

DeepSeek CEO 梁文锋对此态度坚决：“达不到标准，就不发布。”

外界很难判断 R2 的实际表现究竟离“标准”差了多少，但可以推测 DeepSeek 的态度：必须“碾压”才发布。

03｜第二条主线：算力的现实冲击

技术性能之外，更现实的问题是：DeepSeek 没有足够的芯片训练和部署 R2。

根本原因在于 —— H20 芯片断供了。

美国政府于 2025 年 4 月升级了对我国 AI 芯片出口管制，英伟达特供中国市场的 H20 被列入新一轮限制清单。受此影响，DeepSeek 无法继续采购新一批芯片。

回顾一下 R1 的数据（估算数据来源：SemiAnalysis）。

使用芯片包括：H20（3 万块）、H800（1 万块）、H100（1 万块）；
R2 若全面部署，芯片需求只增不减；
一旦 R2 推出，云厂商算力压力更大。

路透社援引知情云厂商员工透露，DeepSeek 已提前向云服务合作商下发了 R2 的资源规格预告（算力需求、并发指标、推理延迟目标等）。

另一方面迟迟未发布，可能是在等待“合规芯片”和“国产替代”的成熟。

04｜沉默也是一种战略？

有观点认为，DeepSeek 当前的“沉默”状态，其实是一种“有意降温”。

不急于发布“半成品”；
不在芯片最紧张的时候发布“最吃算力的模型”；
不跟随竞品节奏，而是等待“精准出击”。

因此，社区中出现了新的猜测：R2 可能将在 7 月下旬 WAIC（世界人工智能大会，World Artificial Intelligence Conference）或 8 月 AI Infra Summit 上首次亮相。

但就目前来看，关于 R2 什么时候发布，DeepSeek 官方始终没有表态。

结语

做个能赢的模型，而不是能发的模型。

如果要总结一句话，那大概是这样：

DeepSeek 不是没准备好上线，而是还没准备好“打胜仗”。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

（文：AI信息Gap）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

01｜R2 “难产”全过程

02｜第一条主线：性能没过关

03｜第二条主线：算力的现实冲击

04｜沉默也是一种战略？

结语

发表评论 取消回复

发表评论取消回复