从大模型到机器人,走进WAIC现场:这届AI真能干活了!

2025世界人工智能大会(WAIC)正在上海火热进行中。作为国内AI领域最具分量的年度盛会,今年的WAIC不仅卷技术,更卷“落地能力”——从自动驾驶、具身智能,到产业AI、国产算力,各大展区比拼的不是噱头,而是真正“能落地”的硬科技。


今天,乌鸦君就带你快速盘点一下本届WAIC展区的几个高光时刻。


/ 01 /

大模型及应用篇:这届AI不只是能想,还开始能干了


在WAIC 2025,AI早已不止于算力和模型的比拼,它正以超出预期的速度加速落地。

从能自动派活、项目复盘的MiniMax Agent,到建模城市交通系统的蘑菇车联MogoMind;从10分钟复刻真人数字主播的百度慧播星NOVA,到可实时主持群聊、识别情绪的Soul 全双工语音大模型,AI正以“智能体+ 多模态”的形态,深入工作、交通、直播、社交等多个真实场景,成为真正可感、可用、可部署的“数字劳动力”。

1.来WAIC当一天“数字高管”,MiniMax的Agent太懂打工人了

MiniMax展区整体以“大模型空间站”为概念设计,几款重磅模型引人关注:MiniMax-M1是全球首个混合架构开源推理模型,视频生成模型Hailuo 02支持1080P原生输出,Speech-02则在国际语音榜单上表现优异。

最惊喜的是Agent展区,亲手试玩MiniMax Agent,真能“秒变高管”——从派活监工到项目复盘,全流程一个智能体搞定,交付质量堪比专业团队。

还有首次亮相的MiniMax × Rokid AI眼镜,语音交互丝滑到像在和真人对话;在AI艺术展区,我一键生成了全球打卡大片,立刻想拍个AIGC微电影试试。

2.蘑菇车联携首个物理世界AI大模型MogoMind亮相WAIC

如果说OpenAI做的是“理解语言的AI”,那蘑菇车联展示的MogoMind,则是“理解物理世界的AI”。

在WAIC 2025,蘑菇车联展出了其物理世界AI大模型MogoMind,聚焦大模型在交通领域的实际应用。不同于传统语言大模型,MogoMind接入实时交通数据,具备全局感知、路径规划、通行能力计算、风险预警等能力,支持城市级交通运行状态的实时建模与判断。


现场展示中,MogoMind可接入道路传感器、车载终端等多源数据,识别路面状况、行人动态、交通标识等物理信息,并基于融合算法完成推理与规划,服务交通管理、出行辅助和自动驾驶。

此外,MogoMind已应用于蘑菇车联旗下的RoboBus、RoboTaxi等自动驾驶产品,其中自动驾驶巴士MOGOBUS搭载端到端“MogoAutoPilot+MogoMind”系统,已在全国10省落地运营,累计行驶超200万公里,服务乘客超20万人次。

同时,在本次活动上,蘑菇车联还展示了数字孪生建模、道路预测、盲区风险感知等功能模块。

3.百度慧播星发布新一代数字人技术NOVA,10分钟完成真人复刻

百度慧播星发布了新一代数字人技术NOVA,支持10分钟完成真人声情动作复刻,预计10月向全行业开放。


据介绍,NOVA技术实现三大关键突破:一是依托文心大模型4.5 Turbo的大师级剧本模式,可生成高质量脚本并驱动多模态协同,实现数字人“形、神、音、容”的高度统一;

二是搭载AI大脑,具备实时数据感知和自主决策能力,能调度多个智能体完成直播互动,并结合热点生成风格化内容;

三是具备高效复刻能力,仅需10分钟真人样本,即可完成声音、表情与动作的精准还原。

该技术已在罗永浩数字人直播中创下5500万GMV,并在蒙牛等品牌落地应用,实现转化率提升33%。目前,NOVA技术已进入邀测阶段,提前应用于教育、健康等十余个行业的达人与商家。

4.AI主持上线!Soul发布全双工语音大模型,群聊也能秒接话

Soul App首次展示了其自研的全双工语音通话大模型,现场模拟AI主持群聊派对,实现无延迟、多轮次、自然流畅的多人互动体验。这一模型突破了传统语音对话的“轮流说话”限制,AI可自主控制节奏、识别情绪、实时生成内容,并辅助活跃群聊氛围。


在现场体验中,AI主持人可在群聊派对中实时发言、引导话题、调节氛围,提升用户参与感。同时,Soul还展示了基于该能力的全双工实时视频通话技术,结合实时人像生成,让用户能看到具象的AI形象。

该模型将于近期在平台开启内测,应用于1V1通话、多人互动等社交场景。


5.49克的AI管家?我在WAIC戴上了Rokid的新眼镜

在WAIC 2025现场,Rokid带来了全新智能眼镜产品——Rokid Glasses,现场上手体验最大的感受是:真的轻!整机仅49克,几乎无感佩戴,外观看起来就像一副普通眼镜,时尚感和实用性兼备。


这款眼镜采用衍射光波导技术,能在透明镜片上清晰显示虚拟信息,同时不遮挡现实视野,实现虚实融合。现场我体验了AI物体识别、实时翻译,响应速度快,交互自然。它还内置1200万像素摄像头,支持拍照录像,并有指示灯保障隐私。

Rokid Glasses已接入通义千问、Deepseek等大模型,集成算力与交互能力,不再只是“能看”,更像一位随身AI助理。

6.AI开始Rapper出道?我在WAIC现场被机器人唱服了!

去年在AI圈爆红的“歌词爆改机”今年再次升级!阶跃星辰携手青心意创,带来全新人形机器人伙伴“Ocra”,在WAIC现场与新生代歌手王晓天同台竞技,上演了一场“AI中国好声音”对决。


这位“能说会跳”的智能机器人,不仅能实时识别语音,还能根据音乐节奏做出情感化肢体动作,与Rapper同步跳舞,现场互动感拉满。

观众也可亲自参与,用阶跃星辰的音乐大模型创作一段AI Rap,并获得《中国好声音》官方系统的评分,体验从作词到表演的“即兴出道”全过程。

/ 02 /

AI基础设施篇:从华为到摩尔线程,重塑AI时代“地基”


在WAIC 2025,过去被认为高冷、遥远的底层算力与平台系统,如今正以更高效、更落地的方式,走进真实场景,支撑起大模型训练、智能体开发和产业级应用的落地需求。


1.384张NPU组成“超级计算机”,昇腾Atlas 900 A3首次实机展出

在WAIC 2025现场,华为展出的“昇腾384超节点”同样让人印象深刻——384张NPU卡通过高速总线互联,整套系统像一台“巨型计算机”一样高效运转,堪称AI训练界的超级发动机。


这台Atlas 900 A3 SuperPoD,解决了传统集群资源利用率低、通信瓶颈等老问题,具备“超大带宽、超低时延、超强性能”三大特点,为大模型训练和推理提供了更稳、更快的底座。

展区还有昇腾联合2700+伙伴打造的超6000个行业解决方案,覆盖金融、医疗、政务、交通等11大场景,展现了AI落地的真实路径。简单说,这不只是炫技术,更是全景展示了“AI怎么真用起来”的样板间。

2.10分钟打造产业智能体,星环科技你如何“用好AI”

星环科技展区以“AI x Data = Future”为核心理念,集中展示了其新一代AI Infra基础设施的全栈能力。

展区设置了“10分钟打造AI产业问答智能体”实操区,观众可现场体验如何利用星环科技LLMops和TKH快速构建一个面向特定行业(如金融、制造、政务)的专属问答智能体,直观展现从数据导入、知识构建到模型接入的全流程自动化。

星环新一代AI Infra架构由四大核心平台组成:支持异构算力资源管理的Resources Platform(资源平台)、统一多模态数据处理的AI-Ready Data Platform(AI就绪数据平台)、支撑训练推理与应用开发的AI Platform(AI平台),以及完成知识管理与工程化的Knowledge Platform(知识平台),形成面向企业级AI应用的全流程闭环。

同时,展区还展示了AI PC赋能、能源智能化生产、金融风控、政务服务等多个行业应用实践,结合真实场景诠释AI如何与业务深度融合,加速企业智能化转型落地。

3.国产GPU真能打?摩尔线程在WAIC“现场交卷”

摩尔线程以“全功能GPU加速美好世界”为主题,集中展示了其围绕国产GPU构建的“云边端”全栈AI解决方案。从大模型训练推理到AI for Science、数字人、智能制造、智慧医疗等多个高算力场景,几乎覆盖了AI产业链的全部关键环节。

其中最具看点的是第二代智算中心KUAE2,可支持超过一万颗GPU部署,具备从FP64到FP8的全精度计算能力,为大模型训练与推理提供稳定算力底座。在推理侧,摩尔线程已支持运行DeepSeek R1等大模型,在国产GPU上实现约100 token/s的解码速度,性能处于行业领先水平。

此外,摩尔线程GPU已在多个场景落地:联合北大和昌平实验室,支持国产分子模拟软件SPONGE和DSDP的高效运行;与超图合作,构建遥感大模型训练与推理全流程国产化方案;在自动驾驶领域,为极佳科技“世界模型”平台提供图形渲染与AI计算支持,显著提升仿真效率。


/ 03 /

机器人篇:全是“打工人”,会跳舞、盖章还能递果冻!


在WAIC上,曾经被视为“未来产物”的机器人、机器狗、机械臂,如今已成为展馆内随处可见的常态展品。具身智能正迅速从概念走向应用,成为本届展会的“顶流”:


从泡咖啡的服务机器人,到能打麻将的陪伴型机器人,再到各类工业作业机器人,正在多个真实场景中加速落地。

1.银河通用亮相WAIC:人形机器人值守便利店,机器狗自动捡垃圾

银河通用在展台展示了其轮式底盘人形机器人Galbot,化身“店员”,可在商超和便利店全天候值守。


观众通过iPad下单后,Galbot能从密集货架中准确取出面包、卤蛋、塑料瓶、果冻杯等商品并送达指定位置。同时,展区还展出了一款具备垃圾回收能力的机器狗,观众可在现场随意丢弃水瓶等垃圾,机器狗能自动识别目标位置并迅速完成拾取操作,体现出其自主感知与动作执行能力。

2.它能跳啦啦操、盖章、分快递,这届WAIC最忙的是智元机器人!

在WAIC 2025现场,智元机器人300㎡超大展台堪称“机器人职场秀”。人形机器人、四足机器人、灵巧手齐上阵。


展台中,远征A2人形机器人能跳啦啦操、讲解展品,活跃展会氛围;灵犀X2则主打社交交互,会主动聊天、识别情绪,还能自然回应被打断的问题;精灵G1一边服务观众盖纪念章,一边在物流区打工分拣包裹,连条码朝下的快递都能自主翻面;远征A2-W聚焦工业应用,精准拆垛、堆叠箱体,还能识别障碍主动提醒。

此外,首次亮相的四足机器人D1 Ultra灵活敏捷,能原地翻滚,模拟复杂地形作业;灵巧手OmniHand还能与观众玩猜拳、跳手势舞,展现极高操作精度。

当天,百事还联合智元发布“百事酷宝”机器人IP,由灵犀X2定制打造,能识别情绪、递可乐、与观众聊天,并将在8月推出联名包装。

3.玩迷宫、叠衣服,Moz1机器人在WAIC火力全开

在千寻智能的点单互动区,观众只需扫码下单,机器人Moz1就会帮你辨识各类饮料、精准定位、稳稳抓取递送到手。


Moz1通过一系列动态动作演示其整机协调性与稳定性:不仅能灵活完成太空步等高难度动作,还能在自由摆动身体的同时,稳稳端起水杯不洒一滴水,展现出强大的动态平衡能力和路径规划能力。

同时,在技术人员的指令下,它能完成“掌上迷宫走珠”、“搭积木”以及精准舞蹈动作,操作流畅自然。

此外,Moz1还完成了对柔性衣物的抓取、折叠与堆叠,将一堆凌乱衣物整齐码放,呈现出出色的柔性物体操作能力。


PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。



(文:乌鸦智能说)

发表评论