CVPR归档 - 每时AI

4K分辨率视觉预训练首次实现！伯克利&英伟达多模态新SOTA，更准且3倍加速处理

下午4时 2025/04/17 作者机器之心

伯克利联合英伟达提出PS3视觉编码器，首次在4K超高分辨率下高效预训练，并引入高分辨率基准测试集4KPro。该方法显著提升了高清场景下的表现和效率。

下午4时 2025/03/19 作者量子位

Zochi发表的两篇论文在ICLR研讨会上通过同行评审，一篇获得了7/6/7的成绩，另一篇获得7/7的成绩。此外，Zochi还展示了其科研过程中的多智能体协作框架，并且生成了研究报告。

下午4时 2025/03/13 作者 PaperWeekly

文章介绍了科研过程中常见的问题，并推荐了一堂由顶会顶刊主席Dr.Chen亲自讲授的系统课程。该课程涵盖了论文选题、创新点设计、实验设计与验证、论文写作与投稿全流程的知识和方法论，适合新手快速提升科研能力和发表高影响力论文。

下午11时 2025/03/10 作者量子位

微软研究院开源Magma模型，首个能理解多模态输入并进行实际操作的基础模型，在CVPR会议上获得接收。该模型融合视觉、语言与动作能力，使用Set-of-Mark和Trace-of-Mark两大标注方法提高准确性。

下午12时 2025/03/08 作者量子位

第五届对抗机器学习Workshop将在2025年6月的CVPR会议上举行，主题为’基础模型+X’。研讨会旨在探讨基础模型及其特定领域应用中的鲁棒性挑战，并设立最佳论文奖等奖项吸引投稿。

下午12时 2025/03/03 作者量子位

上交大EPIC实验室提出的新方法NFCM将数据集蒸馏转化为极小化极大优化问题，显著减少了显存占用和提升了训练速度，并且在多个基准数据集中取得了优异性能。

下午4时 2025/02/27 作者机器之心

CVPR 2025 共收到 13008 篇有效论文，最终录取 2878 篇（接收率 22.1%），创历史新低。部分审稿人被发现不负责任并拒收 19 篇论文，引发讨论。

下午12时 2025/02/24 作者机器之心

计算机视觉与模式识别会议CVPR将于2025年召开，首届计算机视觉推理扩展研讨会（ViSCALE）将探讨Test-time Scaling在计算机视觉中的应用与发展潜力。

MLNLP社区举办学术Talk活动，特邀北京交通大学陶仁帅分享高质量学术论文Rebuttal撰写体会，涵盖技巧、策略和常见误区，帮助学生提高投稿成功率。

下午2时 2024/12/08 作者新智元

CVPR 2025提出七条审稿新规应对投稿量激增导致的审稿人不足问题，包括限制大模型参与审稿、每位作者最多提交25篇论文等。官方强调禁止使用大模型生成或翻译评审结果。