J'ai développé des environnements au cours de la semaine dernière. Je crois que cela pourrait répondre aux besoins en environnement RL des masses. Il y a eu beaucoup de choses intéressantes et cool à tester, y compris l'environnement de preuve multi-tour Lean4 inspiré de StepRunProver que j'ai créé.
Prime Intellect
Prime Intellect28 août, 03:16
Présentation du Hub des Environnements Les environnements RL sont le principal goulot d'étranglement pour la prochaine vague de progrès en IA, mais les grands laboratoires les verrouillent Nous avons construit une plateforme communautaire pour le crowdsourcing d'environnements ouverts, afin que chacun puisse contribuer à l'AGI open-source.
8,34K