なぜオフラインモデルベースの強化学習は、いまだに長期的なタスクにスケールするのが難しいのでしょうか? MACをご紹介します。MACは、長期的なOGBenchで従来のオフラインMBRL手法を大幅に上回る性能を発揮し、安定した100ステップモデル展開を実現しています。 プロジェクトページ: