
经历了2年的发展,大模型的竞争格局正在快速收拢。
在国外,大模型竞赛的决赛圈被收拢至OpenAI、Anthropic、谷歌、Meta和xAI五家公司。而在国内,DeepSeek的成功极大程度冲击了现有的竞争格局,让行业和市场重新意识到——智能水平比流量更本质,是打进国际赛场真正底气。与此同时,百川、零一等公司的调整使“AI六小虎”的叙事自然瓦解。牌桌上的实力玩家已经悄然形成新五强格局,即字节、阿里、阶跃星辰、智谱AI和DeepSeek,这五家被看好的共同特质在于他们在基础模型上的深厚积累与持续创新能力。
这一切演变背后指向一个事实:智能提升仍然是AGI路线图上的唯一主线。
今年以来,DeepSeek验证了一件事:模型即应用。在陡峭的智能技术面前,阶段性产品很难形成绝对壁垒。任何产品和商业模式的创新都比不上智能的创新。
今天,乌鸦君就带大家来盘点下当下中国大模型产业的新格局。
/ 01 /
“百模大战”告终,“五强争锋”初现
我们先来看看西方局势。去年年底,红杉资本在《AI in 2025: Building Blocks Firmly in Place》报告中对2025年美国人工智能发展趋势提出了三大预测,并判断大模型竞赛已经进入决赛阶段,而入围的选手只有5个,分别是微软/OpenAI、亚马逊/Anthropic、谷歌、Meta和xAI。
在红杉看来,这5家公司各有各的优势:
-
谷歌强在垂直整合能力,因为谷歌是唯一一家拥有自主研发一流芯片的厂商,同时既有自己的数据中心,也有一支非常强大的研究团队;
-
OpenAI最大的壁垒是品牌。体现在收入上,据报道OpenAI的收入已超过36亿美元;
-
Anthropic优势在于人才,是笼络了全球最多人工智能科学家的公司之一;
-
xAI强在数据中心建设,xAI以创纪录的速度打造了10万GPU的Colossus集群,如今已成为数据中心扩展领域的领跑者;
-
Meta则把重心放在开源上,其是行业内唯一一家采取开源策略的科技巨头。一旦前沿技术发展开始放缓,Meta将占据有利地位,利用其开源模型快速传播这些功能。
这种趋势并不是偶然,国内市场也在呈现类似的趋势。随着DeepSeek的横空出世,不仅彻底改变了中美大模型的竞争格局,也一举打破了国产大模型原有的产业版图。
国产大模型“六小虎”中,已有多家开始调整策略,开始转型。比如,百川、零一万物放弃预训练大模型,分别押注医疗AI和全面行业落地;MiniMax收缩To B业务,并专注C端视频生成等场景的海外市场。
但在另一端,我们依然看到有更多资源押注到大模型产业,科技巨头纷纷加大投资,部分头部大模型公司也拿到了投资人的加注。
根据浙商证券报告,2025年字节跳动资本开支有望达到1600亿元,较去年的800亿翻了整整一倍。今年2月,阿里则宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,投资额超过过去十年总和。
而在创业公司方面,我们观察到头部企业过去一年依然还有吸金能力,但是在发展路径上已经明显分野,这不仅表现在前述所说基座模型(智源、阶跃星辰)和垂直应用(如月之暗面、Minimax、百川、零一万物)的分化上,也体现在资本市场的押注上。
乌鸦君认为,初创阵营中最值得关注的是坚持基础模型研发、同时受国资加持的“南北两强”——上海代表队阶跃星辰和北京代表队智谱,这两家先后在去年年底和今年年初完成了一轮大额融资。
对标美国的“五强争霸”,国内大模型市场真正留在牌桌上的实力玩家,已经从“大模型六小强”演变为以基模为核心能力“新五强”格局,即字节、阿里、阶跃星辰、智谱AI和DeepSeek。
/ 02 /
大模型“战国”时代的两条主线
当大模型竞争进入决赛圈,技术决胜点也在发生一些变化。从目前看,下一阶段基模竞争的技术决胜点,将集中在智能上限和多模态能力上。
先说第一点,在通往AGI路线图上,智能提升仍然是最重要的主线。
原因很简单,大模型应用的繁荣,无法脱离基础模型的能力边界。用大家熟知的“木桶原理”来比喻,假设AGI是一只木桶,基础模型的水平就好比木桶的综合完整度,决定了这只桶的容量上限。如果桶的底子很薄,或者四外都是短版仅有一两根长板,那这似乎根本就构不成一个桶。所以只有不断突破基础模型的智能水平,才能提升木桶的整体容量积累源泉,为桶中的大模型应用提供稳定的生态环境。
尤其在Agent 落地过程中,模型能力的差距将被进一步放大。因为Agent需要做长距离多步骤推理,如果模型好5-10%,领先的效果就会被放大很多倍。
另一方面,模型本身也是最大的应用。对模型公司来说,基础模型的能力直接与用户端竞争力高度相关。这也是为什么ChatGPT仍然是AI领域流量最大的应用。
今年年初,DeepSeek异军突起,在没有任何推广投入的情况下,用了很短时间内就抹平了字节豆包花了很多钱砸出来的流量优势,靠的就是更强的模型能力。3月,DeepSeek 的聊天机器人的月访问量已经突破了1650万次。
除了模型智能外,多模态技术也是这场大模型决赛的另一大决胜点。
北京智源人工智能研究院创始理事长,美国国家工程院外籍院士张宏江就曾谈到一个观点:多模态大模型是AGI的终极模型。
在张院士看来,统一的多模态大模型才能够解决所有理解的问题。简单来说,人有80%的信息是通过视觉获得,视觉包含了对象物体、明暗色彩、空间关系等多重高维信息,而语音是单维信息,所以视觉的信息量就比其他的模态要多很多。多模态数据的价值在于,可以提高智能的上限。
尤其在AI落地过程中,多模态技术有着至关重要的作用。比如,有了多模态大模型才能真正开发出通用、能自我规划、自主决策的机器人。
实际上,传统机器人的模型完全是由人来设计的,把复杂任务分解变成“简单任务”,然后对于每个简单任务进行人工设计,由规则来驱动运动的规划,这是非常原始的模型。
有了语言大模型和世界大模型之后,我们能够把复杂的任务通过多模态大模型分成“简单任务”,能够听懂人的这种命令,然后又能够进一步通过视觉模型分解成机器的动作,从而完成复杂-简单-机器动作的过程。
总的来说,统一多模态大模型的“突破”,有望让AGI的奇点加速到来。在这两条技术决胜点之下,我们再来看看这些进去大模型决赛圈的选手,各自有着什么样的优势?
/ 03 /
“基模五强”到底强在哪?
人工智能尤其是大模型的竞争归根结底是一场“豪赌”,考验的是各家家底的综合实力。不仅需要过硬的技术实力、投入巨大的资源,高密度布局人才,还需要强大的决心和定力。在乌鸦君看来,中国AI五强可以划分三个阵营:以字节和阿里为代表的“大厂派”;以阶跃星辰和智谱为代表的“国家队”,还有以DeepSeek 为代表的“特种兵”。
先说说字节,这可能是过去一年国内对AI投入最坚决的公司,没有之一。
字节对AI的投入不仅体现在投入规模,更在于投入的姿势。字节创始人张一鸣像创业者那样向AI投入了大部分精力,字节筹建了独立于原有组织架构的新AI组织Flow和Seed,并且给AI研发团队制定了新的考核方式。
如今,字节在算力芯片层、云计算层(火山引擎)、模型研发层、应用层全链条均有投入。其中,主力产品豆包更是在2024年底成为中国日活最多的AI应用。
而阿里的策略有点类似于Meta,把重点更多放在开源上。阿里不仅是最早选择开源战略,也是国内开源模型最全面的公司。在应用层面,也有夸克和钉钉这样的明星应用。
再来看国家队南北两强中的阶跃星辰。2023年4月在上海徐汇成立的阶跃星辰无疑是上海重资押宝的明星企业。去年年底阶跃星辰宣布完成B轮融资,总融资金额达数亿美元,核心投资方就包括上海国有资本投资有限公司及其旗下基金;
从能力上看,阶跃星辰在模型性能和商业化落地方面表现突出。在模型方面,成立2年,阶跃星辰已经累计发布了22款自研基座模型,其中16款是多模态模型,占比超7成,并在国内外多个权威榜单拿下第一,在行业内被称为“多模态卷王”。
在商业化探索上,阶跃星辰有着清晰的战略和路径。据阶跃星辰创始人、CEO姜大昕此前曾在采访中提到,阶跃将智能终端Agent作为大模型技术落地的关键发力点,已在智能汽车、智能手机、IoT、具身智能等四个关键赛道都拿下了头部客户,包括吉利、Oppo等。
与阶跃类似,智谱也是当之无愧的大模型国家队,模型布局全面,商业路径清晰。根据公司披露,2024年智谱业务保持高速增长,商业化收入增长超过100%,平台日均Tokens消耗量增长150倍。不久前,公司宣布启动IPO,成为大模型初创公司中第一家正式启动IPO流程的公司。
比起以上四家,特种兵DeepSeek的成功路径就相对独特许多,聚焦语言模型,坚定开源路线,走极致工程优化的路子。
回过头来看,以上入围决赛圈的模型公司都有一个共性,那就是有钱+有人。
在金钱方面,字节和阿里自然不必多说,DeepSeek也有着国内最大量化基金公司幻方量化的支持。而智谱和阶跃星辰也分别保持着良好的融资节奏。但比钱更重要的是,这些公司在人才建设上的布局。比如,字节AI研发部门Seed的负责人吴永辉曾经在谷歌主导了神经机器翻译(GNMT)、RankBrainn等项目。
除了科技巨头外,大模型公司的人才密度也不容小觑。就拿阶跃星辰来说, 其首席科学家张祥雨则是一名90后科学家,参与撰写的ResNet(残差网络)论文,被誉为近年来人工智能领域的关键论文之一,引用量超过25万次。
长期来看,通往AGI的道路,是一场综合能力的比拼,资金和人才将是这场竞赛里最关键的因素。原因很简单,资金意味着你所能调到的资源,而人才将决定公司所能触及的高度。
如今,大模型决赛圈的大幕已经开幕。最终谁会脱颖而出,我们拭目以待。
文/林白
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
(文:乌鸦智能说)