Rich Sutton 刚刚发表了自《The Bitter Lesson》以来最重要的关于人工智能的文章:《欢迎来到经验时代》 Sutton 和他的学生 Silver 认为,“人类数据时代”,即以监督预训练和基于人类反馈的强化学习为主导的时代,已经进入了收益递减阶段;未来将属于以下特征的智能体: — 在真实或模拟世界中持续行动, — 通过交互生成和标注自己的训练数据, — 优化基于环境而非仅仅基于人类偏好的奖励, — 并通过终生的经验流不断完善其世界模型和计划。