不做“传统机器人公司”的智元发了个大模型,要让机器人看视频就能进化

智元机器人大模型GO-1通过ViLLA架构学习人类操作视频数据,实现物体追踪、智能跟随和快速泛化能力。该模型利用潜在动作表示从不同来源的视频中学习物理规律,并结合互联网数据进行训练。发布时表示将推动通用机器人能力和算法研究。

比美国Figure AI更进一步!“稚晖君”团队抛出最新具身基座大模型GO-1,提出ViLLA架构

具身智能赛道迎来新一轮技术变革。智元机器人团队发布通用具身基座大模型Genie Operator-1(GO-1),提出ViLLA架构,通过多模态信息处理实现小样本快速泛化和卓越操作能力。

世界首个大规模高质量机器人学习数据集的诞生:具身智能ImageNet时刻

智元科技宣布开源AgiBot World数据集,包含超过百万条真实场景中的原子动作轨迹,适用于机器人学习的研究。该数据集涵盖五大领域,包括灵巧手工具使用、移动物体抓取等复杂任务,并配备六自由度灵巧手和多种传感器。