AI芯片巨头英伟达正面临意外的新一轮出口许可管制。
英伟达在最新公布的一份文件中提到,2025年4月9日,美国政府通知英伟达要求其H20集成电路以及任何其他达到H20内存带宽、互连带宽或其组合产品出口至中国均需获得许可证。2025年4月14日,美国政府再次通知英伟达,该许可证要求将在无限期内有效。
新的限制令直接给英伟达带来了严重业务干扰。英伟达表示,其第一季度业绩中预计与H20产品相关的库存、采购承诺和相关准备金等费用已高达55亿美元。
消息一经公布,4月16日英伟达市值直接下跌超6%,市值蒸发1784亿美元(约合人民币13051亿元),目前已处于2.74万亿美元水平。此次限制可能是迄今为止最强烈的一次政策干预,业内人士认为英伟达的历史性爆发增长可能要因美国出口限制而大大放缓。
不仅如此,路透社援引美国商务部信息称,AMD的MI308 AI芯片向中国出口也将面临管制,网友调侃,很多中国买家甚至都不知道这款AI芯片存在,然而,这款没有H20知名的AI芯片,却也让AMD的市值跟着下跌了约7%。
大国之间的AI技术竞争正处于关键阶段,这一轮AI算力限制可谓来势汹汹。
在美国现行和之前的出口规定下,H20是英伟达可以向中国出口的最先进的AI芯片,也是其当下在中国渗透AI业务的核心产品之一。
此前消息称,包括腾讯、阿里巴巴和字节跳动等中国AI科技大厂和诸多数据中心产品今年都一直在增加H20的订单,以满足市场对高性价比AI模型的旺盛需求,4月初,来自《The Information》报道称,中国市场H20服务器芯片订购量或达160亿美元规模。
H20芯片采用了与H100相同的Hopper架构,以及CoWoS先进封装技术,配置96GB HBM3内存,显存带宽达4.0TB/s,FP8算力为296TFLOPs,FP16算力为148TFLOPS,虽然其AI算力只有H100的约15%左右,不过其在推理任务方面,速度会比H100芯片还快20%。
从AI产业发展趋势看,推理计算任务正在成为当下AI市场的重要增长部分,美国商务部认为H20可能被用于构建AI超级计算机。
中国开源模型DeepSeek的快速崛起在世界范围内产生了巨大影响,其V3和R1模型均达到了世界领先水平,公开论文资料显示其模型也采用了英伟达H800或H20等芯片进行训练开发。
H800是英伟达旗舰芯片H100的另一个中国特供版,但在2022年9月之后,英伟达旗下多款先进AI芯片产品包括A100、A800、H100、H800等都已相继被美国禁令限制。
而AI产业发展迅速的中国一直是英伟达最为关键的市场之一。据市场测算,英伟达2024年在中国市场的收入为171亿美元,其中销售H20 GPU总量超过100万张,仅这款芯片创造的收入预估就达到120亿美元,相关市场行情火爆,一台141GB显存的H20服务器价格据说一度从100万涨到接近140万。
全球多数AI模型都是基于英伟达的CUDA生态开发,如果将训练模型从CUDA迁移到其他算力平台,需重写代码给开发团队带来麻烦,而基于H20可利用现有的CUDA生态,降低开发成本和风险,CUDA生态优势加持H20芯片的定制性能让其在中国AI算力市场占据着重要地位。
黄仁勋上周前往特朗普的海湖庄园出席晚宴进行协商后,业内曾传出白宫改变了限制英伟达向中国出口H20的计划,条件是未来四年内英伟达在美国国内建设5000亿美元的人工智能基础设施。
但数周以来,美国议员们一直在向特朗普政府施压,要求对人工智能相关的尖端技术实施更严格的限制,并且严厉打击芯片走私,英伟达是否已获得H20出口中国的许可,许可限制出口多少成为悬念。
英伟达各种芯片被限制出口之外,想要借机在中国AI市场突围的AMD同样艰难。
美国基汇资本市场(KeyBanc Capital Markets)资深研究分析师约翰・文(John Vinh)本周二将AMD的评级从“增持”下调至“与行业同步”,他表示,尽管近期的需求趋势显示中国超大规模数据中心运营商对AMD MI308芯片的需求有所增加,但鉴于美国会实施进一步的出口限制措施,投行对这种需求增长的可持续性表示怀疑。
2024年,AMD在中国的营收达62.31亿美元,占其全球总营收的24.2%,这种规模远不及英伟达。
为了不错过中国日益增长的人工智能和高性能计算市场,AMD曾悄然开发了Instinct MI309处理器,这是一款性能较低的处理器,专门为满足美国出口规则而定制,但据彭博社报道,AMD的这款新产品性能仍然被判为“超标”,无法从美国商务部获得无条件批准,同样需要获得出口许可证。
但业内人士和一些开发者表示,MI308在中国的市场可能极其小,影响力也没有那么大,小到AMD首席执行官苏姿丰 (Lisa Su)到访中国的时候都很少与合作伙伴提及该产品平台。
AMD现在主打的是MI300系列芯片,有开发者测试发现MI300X在与NVIDIA H200类似的延迟下可实现高达5倍的吞吐量,能使得DeepSeek R1模型的推理性能大幅提升,在高效服务大规模机器学习模型方面具有技术竞争优势,不过MI300出口中国目前也受到严格限制。
从国内市场格局来看,英伟达仍是当下AI算力市场的主流,也是很多AI企业采购的首选,退一步来说,中国有自己的华为Ascend(昇腾系列)AI处理器,AMD想要在两大科技巨头夹缝之间抢占市场是一场硬仗。
尽管英伟达H20受限可能会给AI行业带来新的艰难挑战,但一定程度上也会给华为、寒武纪、摩尔线程等在内的中国AI芯片公司带来突围增长机会。
近期,华为基于Ascend 910C打造的CloudMatrix 384解决方案就得到了广泛关注,据悉能与英伟达GB200 NVL72直接竞争,CloudMatrix 384由384块Ascend 910C芯片组成,通过全对全拓扑结构连接,利用五倍的Ascend数量弥补每块GPU性能仅为Nvidia Blackwell的三分之一,完整的CloudMatrix系统可提供300 PFLOP的密集BF16算力。
其他国产厂商们也正在加速进攻英伟达“替代”市场。例如寒武纪公布的第五代智能处理器微架构(MLUarch04)能够支持千亿参数大模型训练,壁仞科技开发的BR100,据说可与英伟达A100媲美,摩尔线程自研的MUSA架构对外称已兼容90%CUDA指令,推出的KUAE GPU智算集群在AI推理场景中具备性能优势。
中国AI算力能全面摆脱乃至取代英伟达吗?目前看不太现实,但如果想要获得更加独立自主的AI算力支撑,这却是一条不得不走的长期之路,需要持续披荆斩棘,直至见到曙光。
(文:头部科技)