100万美元图灵奖奖金,强化学习师徒想献给科研自由

新智元报道:80年代,计算机科学家Andrew Barto和Richard Sutton因强化学习研究获得图灵奖。他们认为未来应向多智能体强化学习方向发展,并相信强化学习将在实现通用人工智能中发挥关键作用。两人建议年轻研究人员勇敢追求自己的兴趣,坚持写作。

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

ICLR 2025会议一篇关于’模型崩溃’的研究因未引用同年COLM会议论文而遭拒稿,作者最终成功通过rebuttal被选为亮点论文。该研究揭露了合成数据对AI模型的潜在威胁,引发学术界广泛关注和争议。

前 OpenAI 研究员、清华大学吴翼博士亮相 2025 ML-Summit,剖析大型推理模型强化学习系统

近日,ACM 将 2024 年图灵奖授予强化学习之父 Richard S. Sutton 和 Andrew G. Barto。吴翼博士将出席 4 月在上海召开的全球机器学习技术大会,并介绍针对推理模型和强化学习开发的训练系统 AReaL。