在线教程丨获CVPR 2025最佳论文,通用3D视觉模型VGGT推理速度可达秒级

HyperAI超神经官网上线VGGT教程版块,支持一键部署体验基于纯前馈Transformer架构的通用3D视觉模型。该模型能够从多个视角推断场景三维属性,并在多种三维任务中达到SOTA级别表现。

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

该研究比较了DPO和GRPO在自回归图像生成中的应用效果,发现DPO在域内任务上表现更好,而GRPO在域外泛化能力上更出色。研究还探讨了不同奖励模型及扩展策略对这两种算法的影响。

单应计算加速数十倍、计算量减少95%!基于几何的SKS和ACA矩阵分解被提出

本文提出了一种基于几何变换的快速且可解释的2D单应矩阵分解方法(Similarity-Kernel-Similarity, SKS和Affine-Core-Affine, ACA)。该方法大幅减少了4点求解单应的时间,尤其适用于二维码扫描等应用。