极市干货
CVPR 2025|GoalFlow:目标点驱动,解锁端到端生成式策略新未来
本文提出了一种基于GoalPoint的端到端生成式方法GoalFlow,通过引入密集的GoalPoint词汇表和高效的扩散模型FlowMatching来生成高质量多模态轨迹,在PDMS上达到了90.3%的最佳性能。
ICLR2025|非常简洁的图像复原新方法:退化分类预训练
文章介绍了一种名为DCPT的新图像复原预训练方法,通过退化分类预训练提升模型对不同退化类型的判别能力和高质量图像生成能力,在多种复原任务上取得显著性能提升。
ICLR 2025 LLaVA-MoD:MoE蒸馏训练轻量化多模态大模型
本文提出了一种轻量化多模态语言模型LLaVA-MoD,通过稀疏专家混合架构和渐进式蒸馏策略,在2B规模下使其性能超过7B大模型8.8%,并在幻觉检测任务中超越教师模型。
上海AI实验室发布通用具身智能仿真平台桃源2.0,三行代码定义任务,数采效率最高提升20倍
上海人工智能实验室发布通用具身智能仿真平台GRUtopia 2.0,通过通用模块化框架、场景资产自动化生成和高效数据采集系统三大革新,实现仅用三行代码定义任务,数据采集效率最高提升20倍。