Meta和NYU联合出品MetaQuery:融合 MLLM 深度理解与 Diffusion,开启图像生成的新跃迁
标即可训练,既保持了 MLLM 的理解实力,又在图像生成任务上达到了强劲表现,包括图像编辑和主体驱动
标即可训练,既保持了 MLLM 的理解实力,又在图像生成任务上达到了强劲表现,包括图像编辑和主体驱动
T 架构中用双域感知适配模块与阶段融合控制器,实现身份与运动的自适应联合训练,仅需短时微调即可在保持
北大学者提出MP1框架,引入MeanFlow范式提升机器人动作生成速度和泛化能力。该方法实现毫秒级推理速度,且无需外部一致性约束,大幅提高任务成功率和数据效率。
MLNLP社区致力于推动国内外机器学习与自然语言处理领域的交流合作。社区举办 ‘大语言模型智能体社会模拟’ Workshop,征稿启事公布,邀请相关领域学者参与研讨。