Varför är offline-modellbaserad RL fortfarande så svårt att skala upp till långsiktiga uppgifter? Möt MAC, en skalbar MBRL-metod som överträffar tidigare offline-MBRL-metoder på långsiktiga OGBench, med stabila 100-stegs modellutrullningar. Projektsida: