Hvorfor er offline-modellbasert RL fortsatt så vanskelig å skalere til langsiktige oppgaver? Møt MAC, en skalerbar MBRL-tilnærming som betydelig overgår tidligere offline MBRL-metoder på langsiktige OGBench, med stabile 100-trinns modellutrullinger. Prosjektside: