跳至内容
最强开源多模态模型来了,还顺带拉来了国产 GPU 的半壁江山。
今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。
阶跃 Step 3 的两个关键词是:多模态推理能力领先开源阵营+推理效率在国产芯片上提升至行业顶尖的 300%。
发布会现场,阶跃还宣布成立「模态生态创新联盟」,联合多家国产芯片头部厂商,共同打通从模型到芯片、终端和工业应用的全链路。
一句话概括 Step 3 的定位:不只是「更强」,而是「更综合」。
而这场重磅发布的逻辑,其实早有迹可循。早在 5 月份,阶跃创始人姜大昕就曾在接受 AppSo 采访时表示;
AI 行业的技术发展非常快,依然处于非常陡峭的区间。阶跃不想在这个过程中放弃主流增长或前进的趋势,所以我们还是会坚持做基础模型的研发。
Step 3 是一款主打推理能力和推理效率的旗舰模型产品,无论是文本推理、代码、数学能力,以及最重要的多模态能力,Step 3 都可以胜任,它在多个榜单上的测试结果都非常出色。
在 SimpleVQA 榜单上,Step 3 的得分超过了国内外所有开源的同类模型,成为了最强的开源多模态推理大模型。
阶跃 Step 3 在语言榜单、多模态等榜单上的成绩
而在评估推理效率上,阶跃 Step 3 真正做到了在模型足够好的情况下,推理效率高,应用成本低。
Step 3 从设计伊始就结合多种硬件优化,在主流国产芯片上的推理效率,提升至行业翘楚 DeepSeek 推理效率的 300%;在英伟达 H800 平台上,对比 DeepSeek,也提升 70%,显著降低模型推理的成本压力。
与 DeepSeek 模型对比,左边是在国产芯片上的测试,右边是 NVIDIA H系列芯片的测试
在大模型「卷各种榜单」的今天,阶跃关注的不仅仅是模型智能的上限,更加关注模型是否能做落地应用,能否实现价值。
阶跃 Step 3 在保留基础模型强大推理能力的同时,更强调落地适配。强调在「低算力」环境下也能保持较强的响应速度和处理能力。
姜大昕进一步归纳了评估模型价值的四个维度:多模态(多)、开源(开)、能力强(好)、成本低(省)。而这四点正是 Step 3 发力的核心。
「多」,意味着模型的多模态能力,而不是针对某一项数学能力、代码能力。姜大昕在现场也举例说我们在很多场合,需要的并不是一个能够拿奥数金牌的模型,而是能够读懂一张纸的含义、能够语音和我们交流。
「开」指的是开源,此次发布的阶跃 Step 3,也将在 7 月 31 日向全世界开源。
「好」则是代表模型的能力要足够强,而「省」则是在模型能力足够好的前提下,尽可能降低成本。
阶跃星辰把 Step 3 放在一个二维坐标系里,能力和是否开源。国际头部模型集中在能力强但不开源区;而许多开源模型缺少多模支持或能力不足。Step 3 填补的正是 开源、多模态、推理顶尖 的象限。
这个「黄金法则」也正说明,阶跃 Step 3 不仅「更聪明」,而且更能「跑得起」「用得起」。
现场也展示了几个阶跃 Step 3 多模态能力的演示案例,
首先是色盲测试图片识别,Step 3 快速读出隐藏字母「Step 3」,甚至在推理思维链里自嘲「巧合」。
菜单反光识别:在高反光环境下仍能读取菜名和价格,并精准回答如「无骨鸭掌 58 元」。
群聊+超市小票联合推理题:从两张图中推断每个人的分摊金额,模型生成结果与人工计算极其接近,同时也感受到了因四舍五入导致的 0.03 元误差。
这类视觉+语言+推理的联合能力,更加符合现实使用场景的需求。
而除了视觉的多模态理解推理,阶跃在 Step 3 这个旗舰模型之外,还构建了一套完整的,包含各种能力的模型全家桶;包括语音模型、音乐模型、图像生成、图像编辑和视频生成等等。
阶跃在现场还展示了他们的语音大模型,阶跃 Step-Audio 2,它能够生成各种方言、各种语种、各种角色的声音类型,同时有连续对话、被打断灵敏处理等能力。
目前,所有这些模型目前都可以透过下载阶跃AI 或者前往阶跃官网体验。
不仅是模型发布,阶跃星辰在 WAIC 2025 还宣布与上海国有资本投资有限公司开展深度战略合作,将在资本对接、生态建设、业务协同等方面协作。
同时还披露上海国投将参与阶跃星辰新一轮融资,阶跃也宣布全年收入要向 10 亿人民币冲刺。
阶跃星辰这次还强调了一个核心战略方向,芯片适配能力和生态构建。
Step 3 此次在国产芯片的推理效率上取得了突破性的成绩,且对所有芯片友好。发布会上,阶跃宣布成立「模态生态创新联盟」,拉来了国产 GPU 的半壁江山。
包括华为昇腾、燧原科技、壁仞科技、沐曦、无闻芯穹、天数智芯等在内的 10 余家国产 GPU 头部厂商共同参与。芯片厂商和模型厂商将通过联合技术创新的模式,让大模型和算力双向实现价值最大化,加速推动 AI 真正被各行各业用起来。
目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。
该联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。
过去一年,在很多国产模型努力追 GPT 系列模型能力曲线时,阶跃星辰似乎选择了另一条路径。就像姜大昕在发布会上提到的木桶效应一样,不一定做到方方面面最强,但要先做到「到处能跑」。
Step 3 的发布,除了是能力极限的炫技,更是对「可用性」一次重申。
大模型如果要真正进入生产和生活,就不能只在超算中心跑得飞快、在论文里得分漂亮,而是要能在真实世界里快速响应、低成本部署、长时间稳定运行。
阶跃一直强调要做基础模型,我想之所以叫「基础」,是因为它希望模型真的能像基础设施一样,可靠、普及、负担得起。
WAIC 2025 APPSO 在现场,欢迎加入社群一起畅聊 AI 产品,获取#AI有用功,解锁更多 AI 新知👇
(文:APPSO)