Почему модельно-ориентированное обучение с подкреплением в оффлайне все еще так трудно масштабировать для задач с длинным горизонтом? Познакомьтесь с MAC, масштабируемым подходом к MBRL, который значительно превосходит предыдущие методы оффлайн MBRL на длинных горизонтах OGBench, с устойчивыми 100-шаговыми моделями. Страница проекта: