Çevrimdışı model tabanlı RL'yi uzun ufuk görevlerine ölçeklendirmek neden hâlâ bu kadar zor? MAC ile tanışın; uzun ufuk OGBench'te önceki çevrimdışı MBRL yöntemlerini önemli ölçüde geride bırakan, stabil 100 adımlı model dağıtımlarıyla ölçeklenebilir bir MBRL yaklaşımı. Proje sayfası: