舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA 2025年5月27日16时 作者 机器之心 本文介绍的研究团队将语言模型 LLaDA 拓展至多模态领域,推出扩散大语言模型 LLaDA-V。该模型在多个基准测试中表现出色,并展示了扩散模型在多模态理解领域的巨大潜力。
具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能 2025年3月10日16时 作者 新智元 务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操作