极市干货
ICLR 2025 Spotlight|Serge Belongie组与ETH提出:「免费」多模态信息助力3D小样本分割!
创新方法:在无需额外标注成本的前提下,融合了文本,2D,3D信息,助力模型更好地适应到新类别。
>>
多模态方向开源数据集资源汇总
MINT-1T 数据集是一个 1 万亿个文本标记和 34 亿张图像的开源数据集,扩展了现有开源数据集的 10 倍。WuDaoCorpora 是一个由北京智源人工智能研究院构建的大规模、高质量数据集。Conceptual Captions 提供超过 300 万张带有自然语言字幕的配对图像。SBU Captions 数据集中有 100 万带标题的照片描述图像。MiniGPT-4 使用高质量图文对进行微调,Ego-Exo4D 包含三种精心同步的语言视频数据集。
CVPR25|零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升 10 倍
中国科学技术大学联合曼彻斯特大学提出AdaVD方法,通过正交补运算和自适应擦除移位机制实现精准、高效的概念擦除,提升先验保护能力2到10倍。