极市干货
AAAI2025 北大&数原提出MMGDreamer:混合模态图驱动,几何可控的3D室内场景生成新标杆
合模态图(Mixed-Modality Graph)的双分支扩散模型,用于实现几何精准可控的3D室内
ICLR2025|ClassDiffusion: 使用显式类别引导的一致性个性化生成
本文提出了一种新的方法ClassDiffusion来提升个性化生成的一致性。通过分析发现个性化微调导致模型在遵循复杂提示词方面能力下降的根本原因是语义空间中的语义偏移,进而提出了ClassDiffusion以减少个性化概念与类别分布中心的语义距离,从而提高一致性。
CVPR 2025|流式在线视频理解:新基准OVBench & 新模型VideoChat-Online
zhihu.com/p/32012639949
编辑丨极市平台
极市导读
提出了一个全面的评测基准O
CVPR 2025 加快22倍!Meta提出EdgeTAM:基于SAM 2的高效视频分割模型,性能与速度兼得!
提出了EdgeTAM,这是一个基于SAM 2的高效视频分割模型。EdgeTAM通过引入2D空间感知器