Richard Sutton 归档

下一代 AI 系统怎么改？让 AI 自己改？!

2025年7月13日12时作者机器之心

下一代AI系统如何改进？让AI自己改！DGM验证了怎样的路径？‘自进化’范式有哪些特征？Sakana AI和UBC提出‘达尔文哥德尔机’探索AI自主学习能力

2025年6月22日16时作者新智元

员放话「5年内AI干掉白领」，却被Karpathy等联手泼冷水！持续学习真的可能吗？RL的真正边界、

2025年6月10日11时作者量子位

新晋图灵奖得主Richard Sutton预测大模型主导是暂时的，未来五年甚至十年内AI和强化学习将转向通过Agent与世界的第一人称交互获取‘体验数据’的学习。他强调AI需要新的数据来源，并且要随着增强而改进。他认为真正的突破还是来自规模计算。

2025年6月7日23时作者甲子光年

I领域的顶级盛会——第七届北京智源大会在中关村国家自主创新示范区会议中心正式落下了帷幕。
「甲子光年

2025年5月13日16时作者新智元

新智元报道：80年代，计算机科学家Andrew Barto和Richard Sutton因强化学习研究获得图灵奖。他们认为未来应向多智能体强化学习方向发展，并相信强化学习将在实现通用人工智能中发挥关键作用。两人建议年轻研究人员勇敢追求自己的兴趣，坚持写作。

2025年3月6日12时作者量子位

计算机最高奖图灵奖揭晓。强化学习先驱Andrew Barto与Richard Sutton共同获奖，他们被评价为’引领基础AI技术开发的研究人员’。两位是师徒关系，Barto和他的博士研究生Sutton将马尔可夫决策过程的数学基础应用于强化学习框架中。

2025年3月6日8时作者新智元

Andrew Barto，获得了2024年图灵奖。有人说，图灵奖终于颁给了强化学习，这是迟到的「奖励

2025年3月6日8时作者 AI寒武纪

重磅消息！ACM图灵奖揭晓2024年得主Andrew Barto和Richard Sutton因强化学习领域的奠基性贡献获奖。两位教授是AI核心技术——强化学习的先驱，推动了AlphaGo战胜人类围棋冠军和ChatGPT等技术的发展。

2025年3月5日23时作者机器之心

强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。他们提出的强化学习理论为 AI 研究奠定了基础，并在机器人技能学习、网络拥堵控制等领域取得了成功。