Rich Sutton heeft zojuist zijn belangrijkste essay over AI gepubliceerd sinds The Bitter Lesson: "Welcome to the Era of Experience" Sutton en zijn adviseur Silver stellen dat het "tijdperk van menselijke gegevens", gedomineerd door gesuperviseerde pre-training en RL-van-menselijke-feedback, een afnemend rendement heeft bereikt; De toekomst zal toebehoren aan agenten die — onafgebroken in reële of gesimuleerde werelden te handelen; - hun eigen trainingsgegevens genereren en labelen door middel van interactie — beloningen optimaliseren die gebaseerd zijn op de omgeving in plaats van alleen op menselijke voorkeur, en - hun wereldmodellen en plannen verfijnen over levenslange stromen van ervaring.