Чому офлайн-модельний RL досі так складно масштабувати для довгострокових завдань? Познайомтеся з MAC — масштабованим підходом MBRL, який значно перевершує попередні офлайн-методи MBRL на довготривалому OGBench, зі стабільними 100-кроковими запусками моделей. Сторінка проєкту: