极市干货，作者每时AI

CVPR 2025 Highlight 华科、道通智能、英特尔开源双目深度估计大模型MonSter

2025年4月8日23时作者极市干货

MonSter是一种新颖的立体匹配方法，通过双分支结构结合单目深度估计和立体匹配的优势，在五个常用基准上均达到SOTA性能，并且在不同数据集上的泛化性表现优异。

2025年4月8日23时作者极市干货

或者文本生成任务的，从头训练的 Transformer 模型。
>>
加入极市CV技术交流群，走在计

2025年4月7日23时作者极市干货

种新型的实时交互式 3D 场景生成方法
WonderTurbo
，能够在 0.72 秒内生成高质量的

2025年4月7日23时作者极市干货

大、北大提出
In Context Editing
，这是一种突破传统微调，从自诱导分布中学习知识的

2025年4月4日11时作者极市干货

个面向DiT模型的条件生成框架
EasyControl
，通过条件注入LoRA模块、位置感知训练范式

2025年4月2日23时作者极市干货

据集，超过 SD-XL 的 T2I 模型。
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
太

2025年4月2日23时作者极市干货

视觉基础模型的生成式预训练的工作总结。
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
大语

2025年4月2日23时作者极市干货

出MMKE – Bench，这是史上最全面的多模态知识编辑基准，涵盖跨越33个广泛的类别视觉实体编辑

2025年4月2日8时作者极市干货

开始构建 Mamba 的全部代码过程，作者将Mamba算法模型从理论转化为具体实践。这一探索过程不仅

2025年4月2日8时作者极市干货

中山大学联合上海人工智能实验室提出了LOKI，这是一个面向多模态合成数据检测的全新测试基准，涵盖图