ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
MIT副教授何恺明的新研究揭示,尽管过去十多年里业界为构建更大、更多样化数据集做了努力,但现代神经网络似乎越来越善于‘识破’并利用这些数据集中潜藏的偏差。此发现引发对消除数据集偏差是否已取得胜利的质疑。
MIT副教授何恺明的新研究揭示,尽管过去十多年里业界为构建更大、更多样化数据集做了努力,但现代神经网络似乎越来越善于‘识破’并利用这些数据集中潜藏的偏差。此发现引发对消除数据集偏差是否已取得胜利的质疑。
u.com/p/21290410831
编辑丨极市平台
极市导读
Deepseek R1 Zero模
高盛亚洲团队下调全球服务器市场规模预期,部分AI服务器生产计划从2025年推迟到2026年。预计2026年交付量将显著增加,同时强调AI推理服务器市场将在2025年迎来更高热度。
花旗研报指出,DeepSeek的出现推动了低成本和边缘化的人工智能技术,联发科凭借云边协同布局和ASIC技术优势将受益。预计到2026年联发科将获得超过20亿美元的云服务提供商AI加速器业务收入。
Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。