CVPR 2025 UniRestore:统一图像复原新框架
本文提出UniRestore框架,结合互补特征恢复模块和任务特征适配器,有效弥合感知式与任务导向图像恢复之间的差距,在多项任务中展现了领先性能和良好的可扩展性。
本文提出UniRestore框架,结合互补特征恢复模块和任务特征适配器,有效弥合感知式与任务导向图像恢复之间的差距,在多项任务中展现了领先性能和良好的可扩展性。
研究者提出一种新的正则化方法Dispersive Loss,旨在改进扩散模型生成图片的效果。该方法不需要定义正样本对,通过鼓励中间表示的分散性来提高模型的泛化能力和生成质量。论文在ImageNet数据集上进行了测试,并展示了其有效性。
TextHarmony是首个在单一模型中实现视觉文本感知、理解与生成任务的OCR研究,通过ViT+MLLM+Diffusion架构及Slide-LoRA缓解模态不一致问题,显著提高OCR相关任务性能。
kGIT 方案做生成的生成理解统一模型。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
太长
一本好的教材兼具体量恢弘与思想深邃,《深度学习:基础与概念》就是这样的一本经典入门书籍,作者Christopher M.Bishop长期深耕人工智能领域,并获得多位AI领域的重量级专家推荐。
生成任务相统一的Transformer模型
Show-o,它通过结合自回归和离散扩散建模,创新性地用