Por que é que o RL baseado em modelos offline ainda é tão difícil de escalar para tarefas de longo prazo? Conheça o MAC, uma abordagem MBRL escalável que supera significativamente os métodos MBRL offline anteriores no OGBench de longo prazo, com rollouts de modelo estáveis de 100 passos. Página do projeto: