CVPR 2025 Highlight 华科、道通智能、英特尔开源双目深度估计大模型MonSter
MonSter是一种新颖的立体匹配方法,通过双分支结构结合单目深度估计和立体匹配的优势,在五个常用基准上均达到SOTA性能,并且在不同数据集上的泛化性表现优异。
MonSter是一种新颖的立体匹配方法,通过双分支结构结合单目深度估计和立体匹配的优势,在五个常用基准上均达到SOTA性能,并且在不同数据集上的泛化性表现优异。
种新型的实时交互式 3D 场景生成方法
WonderTurbo
,能够在 0.72 秒内生成高质量的
大、北大提出
In Context Editing
,这是一种突破传统微调,从自诱导分布中学习知识的
个面向DiT模型的条件生成框架
EasyControl
,通过条件注入LoRA模块、位置感知训练范式
出MMKE – Bench,这是史上最全面的多模态知识编辑基准,涵盖跨越33个广泛的类别视觉实体编辑
中山大学联合上海人工智能实验室提出了LOKI,这是一个面向多模态合成数据检测的全新测试基准,涵盖图