多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
字节及南洋理工大学联合研究,提出一种基于强化学习的多模态模型自主搜索训练方法,在视觉问答任务中显著提升性能,减少约30%的搜索次数。
字节及南洋理工大学联合研究,提出一种基于强化学习的多模态模型自主搜索训练方法,在视觉问答任务中显著提升性能,减少约30%的搜索次数。
南洋理工大学等提出基于Flow Matching的3D生成框架GaussianAnything,支持多模态可控的高效、高质量3D生成,适用于图片和文本条件。