Mengapa RL berbasis model offline masih sangat sulit untuk diskalakan ke tugas jangka panjang? Temui MAC, pendekatan MBRL yang dapat diskalakan yang secara signifikan mengungguli metode MBRL offline sebelumnya pada OGBench cakrawala panjang, dengan peluncuran model 100 langkah yang stabil. Halaman proyek: