De ce este RL bazat pe modele offline încă atât de greu de scalat la sarcini pe termen lung? Faceți cunoștință cu MAC, o abordare MBRL scalabilă care depășește semnificativ metodele MBRL offline anterioare pe OGBench pe termen lung, cu implementări stabile de modele în 100 de pași. Pagina proiectului: