Perché il RL basato su modelli offline è ancora così difficile da scalare a compiti a lungo termine? Incontra MAC, un approccio MBRL scalabile che supera significativamente i metodi MBRL offline precedenti su OGBench a lungo termine, con rollout del modello stabili di 100 passi. Pagina del progetto: