Dlaczego offline model-based RL wciąż jest tak trudny do skalowania do zadań długoterminowych? Poznaj MAC, skalowalne podejście MBRL, które znacząco przewyższa wcześniejsze metody offline MBRL w długoterminowym OGBench, z stabilnymi modelami 100-krokowymi. Strona projektu: