Pourquoi le RL basé sur des modèles hors ligne est-il encore si difficile à adapter aux tâches à long terme ? Découvrez MAC, une approche MBRL évolutive qui surpasse de manière significative les méthodes MBRL hors ligne précédentes sur OGBench à long terme, avec des déploiements de modèle stables sur 100 étapes. Page du projet :