密振兴归档 - 每时AI

ICML2025｜多模态理解与生成最新进展：港科联合SnapResearch发布ThinkDiff，为扩散模型装上大脑

多模态理解与生成新方法ThinkDiff在ICML2025上提出，仅需少量数据和计算资源，让扩散模型具备推理能力，并通过视觉-语言训练和掩码策略传递VLM的多模态推理能力，大幅提高图像生成质量。

2025年7月16日16时作者机器之心

香港科技大学联合Snap Research提出ThinkDiff方法，仅需少量图文对和数小时训练让扩散模型具备多模态推理与生成能力。