具身智能领域代表大模型及医疗多模态数据合成思路
2023年12月27日《Qwen2.5和RoboBrain 2.0在医疗领域与具身智能中的应用》介绍了Qwen2.5用于医疗领域的空间理解模型MedEvalKit以及RoboBrain 2.0 32B用于室内场景建模,强调了它们如何结合医学图像数据进行训练,并生成结构化的3D布局。
2023年12月27日《Qwen2.5和RoboBrain 2.0在医疗领域与具身智能中的应用》介绍了Qwen2.5用于医疗领域的空间理解模型MedEvalKit以及RoboBrain 2.0 32B用于室内场景建模,强调了它们如何结合医学图像数据进行训练,并生成结构化的3D布局。
专注AIGC领域的专业社区介绍SpatialLM模型,该模型通过结合点云数据的特征提取、对齐和语言生成,实现了高效的空间三维场景理解与生成。
SpatialLM是群核科技开源的一款空间理解多模态模型,能够从普通手机拍摄的视频中重建精细3D场景,并标注房间结构、家具摆放和通道宽度等信息。其核心功能包括生成3D场景、提升机器人的空间认知能力、降低数据采集成本以及在虚拟现实中提供丰富场景支持。
近日杭州六小龙之一群核科技在GTC 2025大会开源了SpatialLM模型,它是一款大语言模型,能够处理来自多种来源的三维点云数据,并生成结构化的三维场景理解输出。该模型采用了多模态结构,能将非结构化的三维几何数据转化为机器可读格式。