
“
作者|机器人开放社区
机器人开放社区现场了解到,悟能具身智能平台以商汤具身世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能够为机器人、智能设备提供强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。
悟能具身智能平台可赋能机器人等各种终端硬件,实现对世界万物的感知理解能力,并支持嵌入到端侧芯片,具有强大的场景适配性。
现场,商汤科技董事长兼首席执行官徐立展示了搭载具身世界引擎的人形机器人,生动讲解“长安的荔枝”PPT的效果,语言自然,风趣幽默,不仅可以自动翻页,还能回答各类问题,并进行阶段性小结。
商汤具身世界模型还能够生成多视角视频,并确保良好的时间一致性和空间一致性,让机器能够理解、生成、编辑真实世界,在空间层面实现世界交互,让“在真实的街道场景中玩‘极品飞车’”成为可能。
商汤具身世界模型还能构建面向人、物、场的4D真实世界。用户仅需要输入简单的提示词,比如“在厨房区域的架子上找东西”,“进入娱乐室、向右转,然后打开通往院子的门”等等,具身世界模型就能自主进行位姿、动作骨架和指令的生成。
此前有媒体报道,悟能具身智能核心创始成员由商汤联合创始人王晓刚、陶大程等视觉技术大咖组成。
公开信息显示,王晓刚毕业于中国科技大学少年班,2001年获得电子工程与信息科学学士学位,2004年获得香港中文大学信息工程硕士学位,并于2009年在麻省理工学院实验室完成计算机博士学位。 主要研究领域包括计算机视觉、深度学习、目标检测以及人脸识别等。
2016年加入商汤科技任联合创始人、首席科学家。2022年,商汤将汽车相关业务打包成立“绝影智能汽车事业群”,由王晓刚担任CEO
在研究成果层面,王晓刚带领开发的DeepID系列首次让机器的人脸识别超过了人的眼睛,2015年,由王晓刚带队,打败对手谷歌,取得了中国学者在ImageNet评测中的第一个世界冠军。
2016年,其带领的SenseTime-CUHK团队在ILSVRC(ImageNet大规模视觉识别挑战赛)的物体检测、视频对象检测/跟踪、场景解析三项比赛中荣获冠军。
陶大程在英国伦敦大学取得博士学位,先后任教中国香港理工大学、新加坡南洋理工大学,澳大利亚悉尼科技大学、悉尼大学,2021年加入京东探索研究院担任院长,并于2023年年初离职。其在表征学习领域取得显著成就,领导开发了一系列算法,研究成果广泛应用于视觉信号质量评估和增强、目标跟踪与识别、视频监控、人机交互、无人驾驶等领域。
(文:机器人开放社区)