深度|WAIC百机鏖战,它凭超百杯「丝滑零误」咖啡锁定海量订单

01 WAIC新考题:当机器人学会冲咖啡

人头攒动的WAIC世界人工智能大会,是前沿技术的竞技场,今年超百台人形机器人同场竞技、各展所长,而观众的阈值已然不仅限于去年的十八金刚。如何让机器人更好地理解人类意图、更灵巧地与物理世界交互,真正摆脱 遥控玩具“Demo”,尽早走入日常生活中,成为了大众关注的新焦点。

在喧嚣的展会一角,一家名为「跨维智能」的公司,用一杯从容不迫的咖啡,给出了一份令人信服的答卷。这不仅是一场技惊四座的演示,也清晰地解释了,为何这支低调的团队能获得数亿元融资,并能在ICRA 2025 WBCD双臂操作大赛上,凭借全程自主的VLA模型,从全球88支顶尖队伍中脱颖而出,摘得世界冠军。

02 黑马背后:世界冠军团队的造脑哲学

「跨维智能」这匹黑马,究竟是何来历?

跨维智能(DexForce)由世界知名的机器人与计算机视觉专家、香港中文大学(深圳)教授贾奎于2021年创立。其核心团队汇聚了来自麻省理工学院、德国不来梅大学、清华大学等顶尖学府的科研人才,基因里就刻着深厚的技术烙印。

与许多从硬件或单一场景切入的公司不同,跨维智能从一开始就瞄准了具身智能的终极命题:为机器人打造一个通用的大脑。他们的核心,是构建一个由物理引擎、大模型与多模态感知三位一体驱动的智能基座。换言之,他们不只是在教机器人做什么,而是在教它如何学,目标是让智能系统能够低成本地自我进化,并赋能给各类机器人硬件。这一前瞻性布局也获得了资本市场的高度认可,公司近日宣布完成数亿元A1&A2轮融资,投资方包括领投方成都科创投、洪泰基金,以及天鹰资本、联想创投等一众新老股东。

03 一杯临场不乱的咖啡:智能的试金石

在跨维智能展台,我们见证的不仅是技术,更是一种智能的韧性

观众通过语音下达指令,机器人便开始了行云流水般的操作。它精准地从一堆胶囊中识别并抓取目标,一次优雅的空中换手后,稳稳将胶囊放入咖啡机。整个过程流畅连贯,展现了高度的协调性与精细操作能力。

然而,真正的考验来自一次故意的发难

就在机器人准备放置胶囊时,工作人员突然上前,拿走了它手中的胶囊。面对这突如其来的干扰,机器人并未宕机或陷入混乱。它只是短暂地停顿,双眼摄像头重新扫描桌面,仿佛在思考对策。几秒后,它重新定位目标,规划出新的动作路径,再次精准取回胶囊,从容地完成了后续任务。

智能的试金石,并非从不出错,而是在于面对错误和意外时,如何自主解决问题。 这种强大的实时纠错与动态适应能力,正是其真智能的体现。

在等待咖啡制作的间隙,机器人还会主动与观众进行语音对话,介绍一些咖啡相关的小知识,将科技的冰冷瞬间转化为温暖的陪伴。最后,机器人会以一个合适的姿态从杯架上取下杯子,接取基本装满液体的咖啡,再将制作好的咖啡稳稳地递送到观众面前,完成整个服务闭环。

那么,这行云流水般的操作背后,究竟隐藏着怎样的技术秘密?

04 技术解码:跳出数据飞轮,打造具身智能的引擎

这场演示的背后,是跨维智能一套与行业主流不尽相同的技术哲学。

当前具身智能领域最大的痛点是什么? 跨维的技术专家坦言:是那个昂贵且低效的数据飞轮

主流的Real2Real范式,极度依赖在真实世界中采集海量数据来训练模型。但每一次数据采集,都意味着高昂的成本。更重要的是,真实世界的场景组合近乎无穷,你永远无法穷尽所有可能,数据的多样性和质量都难以保证。这个沉重的数据飞轮,正拖慢整个行业前进的脚步。

跨维的破局之道,在于角色的转换:从数据的消费者,变为数据的生产者

他们将这套体系命名为引擎驱动的Sim2Real VLA”,核心是打造一个能自动化、低成本、大规模生产高质量训练数据的数据工厂。通过在高度仿真的虚拟世界(Sim)中,让模型经历亿万次的训练,掌握物理世界的规律和通用技能,再以极高的效率迁移到现实世界(Real)中。

所以,WAIC上的咖啡机器人,更像是那座强大数据工厂所产出的一个标杆产品。它证明了,掌握了低成本、高质量自我生产数据的能力,才是通往通用具身智能的康庄大道。

05 未来图景:从专用到通用的范式革命

跨维智能的人形机器人咖啡制作现场展示,本质上是具身智能从实验室走向现实世界的缩影。其技术突破不仅体现在人形机器人本体操作精度的提升,更在于通过物理引擎 + 大模型 传感器的三位一体架构,构建了可泛化的智能基座。正如创始人贾奎教授所言:当机器人能够理解咖啡杯的物理属性、实时规划动作路径,并在突发情况下自主调整策略时,我们才真正触及了具身智能的本质 ——让机器拥有与人类对等的物理世界认知能力

ICRA 2025 WBCD一举夺冠,再到WAIC超百杯咖啡的自主连续操作,跨维智能用最极致的坚持,证明了以Sim2Real的方式驱动VLA成为高效、可行的路径,并在现场获得了大量意向订单,走出了一条为真实场景而生,具身价值赋能的特色路径。

未来,这种技术范式或将重构商业服务、康养服务、工业生产、家庭服务等领域的底层逻辑,最终实现迈向通用具身智能” 的普惠愿景。在这场智能革命中,跨维智能的探索揭示了人类与机器协同进化的终极方向 —— 当机器人能够像人类一样理解、感知、决策时,物理世界的操作边界将被彻底重构。

——-

(文:Z Potentials)

发表评论