¿Por qué el aprendizaje por refuerzo basado en modelos offline sigue siendo tan difícil de escalar a tareas de largo horizonte? Conoce MAC, un enfoque de MBRL escalable que supera significativamente a los métodos anteriores de MBRL offline en OGBench de largo horizonte, con rollouts de modelo estables de 100 pasos. Página del proyecto: