Por que o RL baseado em modelos offline ainda é tão difícil de escalar para tarefas de longo prazo? Conheça o MAC, uma abordagem escalável de MBRL que supera significativamente os métodos MBRL offline anteriores no OGBench de longo prazo, com implementações estáveis de modelos em 100 etapas. Página do projeto: