Richard Sutton
图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI
计算机最高奖图灵奖揭晓。强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为’引领基础AI技术开发的研究人员’。两位是师徒关系,Barto和他的博士研究生Sutton将马尔可夫决策过程的数学基础应用于强化学习框架中。
重磅!2024图灵奖颁给强化学习两位大神,AlphaGo、ChatGPT,DeepSeek背后功臣!
重磅消息!ACM图灵奖揭晓2024年得主Andrew Barto和Richard Sutton因强化学习领域的奠基性贡献获奖。两位教授是AI核心技术——强化学习的先驱,推动了AlphaGo战胜人类围棋冠军和ChatGPT等技术的发展。
刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。他们提出的强化学习理论为 AI 研究奠定了基础,并在机器人技能学习、网络拥堵控制等领域取得了成功。
打「推理补丁」之外,实现更强的AI还有哪些不一样的思路?
本周会员通讯解读AI & Robotics领域内三则重要资讯:一是探讨如何通过不同思路实现更强的人工智能;二是讨论关于元宇宙、皮卡丘世界模型以及Meta的技术布局;三是诺奖得主论坛的焦点话题及应用中的潜在副作用。
流式深度学习终于奏效了!强化学习之父Richard Sutton力荐
本文提出了一种名为 stream-x 的深度强化学习算法,用于解决流式障碍问题。该方法无需使用重放缓冲区、批量更新或目标网络,即可从最新的经验中进行学习,并且在样本效率上可与批量强化学习相当。
强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法
在强化学习领域提出了一种名为’奖励聚中’的新思想,旨在通过从实际观察到的奖励中减去平均值来改进算法性能。该方法适用于几乎所有强化学习算法,并且当折扣因子接近1时效果最佳。