在线教程丨获CVPR 2025最佳论文,通用3D视觉模型VGGT推理速度可达秒级
HyperAI超神经官网上线VGGT教程版块,支持一键部署体验基于纯前馈Transformer架构的通用3D视觉模型。该模型能够从多个视角推断场景三维属性,并在多种三维任务中达到SOTA级别表现。
HyperAI超神经官网上线VGGT教程版块,支持一键部署体验基于纯前馈Transformer架构的通用3D视觉模型。该模型能够从多个视角推断场景三维属性,并在多种三维任务中达到SOTA级别表现。
该研究比较了DPO和GRPO在自回归图像生成中的应用效果,发现DPO在域内任务上表现更好,而GRPO在域外泛化能力上更出色。研究还探讨了不同奖励模型及扩展策略对这两种算法的影响。
何恺明在CVPR会议上分享了关于识别模型演进与生成模型未来方向的见解,他提出了一种名为MeanFlow的新方法用于实现单步生成任务,并介绍了多种研究方向和问题。
本文提出了一种基于几何变换的快速且可解释的2D单应矩阵分解方法(Similarity-Kernel-Similarity, SKS和Affine-Core-Affine, ACA)。该方法大幅减少了4点求解单应的时间,尤其适用于二维码扫描等应用。