学术归档 - 第46页共283页

在线教程丨获CVPR 2025最佳论文，通用3D视觉模型VGGT推理速度可达秒级

2025年6月20日16时作者 HyperAI超神经

HyperAI超神经官网上线VGGT教程版块，支持一键部署体验基于纯前馈Transformer架构的通用3D视觉模型。该模型能够从多个视角推断场景三维属性，并在多种三维任务中达到SOTA级别表现。

2025年6月20日16时作者机器之心

解决音乐 AIGC 中
音质、音乐性与生成速度
这三大共性难题，基于 LLM-DiT 的融合架构，模

2025年6月20日11时作者机器之心

lya Sutskever 致力于探索 AI 安全的理想边界，而 Andrej Karpathy 则

2025年6月20日11时作者机器之心

的书。它让人相信：技术不是死物，而是人与世界持续互动的方式。
如果说「天工」代表了中国古代对「工程」

2025年6月19日23时作者机器之心

该研究比较了DPO和GRPO在自回归图像生成中的应用效果，发现DPO在域内任务上表现更好，而GRPO在域外泛化能力上更出色。研究还探讨了不同奖励模型及扩展策略对这两种算法的影响。

2025年6月19日23时作者机器之心

何恺明在CVPR会议上分享了关于识别模型演进与生成模型未来方向的见解，他提出了一种名为MeanFlow的新方法用于实现单步生成任务，并介绍了多种研究方向和问题。

2025年6月19日23时作者机器之心

域掀起一场由大型语言模型（LLM）引领的生成式革命，它们凭借着强大的端到端学习能力、海量数据理解能力

2025年6月19日16时作者 HyperAI超神经

多部门团队开发出一种全新数据驱动方法，基于大语言模型（LLM）与多头神经网络架构，实现对水泥替代材料

2025年6月19日16时作者机器之心

本文提出了一种基于几何变换的快速且可解释的2D单应矩阵分解方法（Similarity-Kernel-Similarity, SKS和Affine-Core-Affine, ACA）。该方法大幅减少了4点求解单应的时间，尤其适用于二维码扫描等应用。

2025年6月19日16时作者 PaperWeekly

PR 2025 接收为 Highlight（前 13.5%）并完全开源
。
论文标题：
DyFo: