舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA 下午4时 2025/05/27 作者 机器之心 本文介绍的研究团队将语言模型 LLaDA 拓展至多模态领域,推出扩散大语言模型 LLaDA-V。该模型在多个基准测试中表现出色,并展示了扩散模型在多模态理解领域的巨大潜力。
具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能 下午4时 2025/03/10 作者 新智元 务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操作