نشر ريتش ساتون للتو أهم مقالته عن الذكاء الاصطناعي منذ الدرس المر: "مرحبا بكم في عصر التجربة" يجادل ساتون ومستشاره سيلفر بأن "عصر البيانات البشرية" ، الذي يهيمن عليه التدريب المسبق الخاضع للإشراف و RL-from-human feedback ، قد حقق عوائد متناقصة. المستقبل سيكون ملكا للوكلاء الذين - التصرف باستمرار في عوالم حقيقية أو محاكاة، - إنشاء بيانات التدريب الخاصة بهم وتسميتها من خلال التفاعل - تحسين المكافآت القائمة على البيئة بدلا من تفضيل الإنسان وحده ، و - صقل نماذجهم وخططهم العالمية على مدى تدفقات الخبرة مدى الحياة.