Der TechCrunch-Artikel vom Dienstag über RL hat diese wichtige Bibliothek vergessen zu erwähnen: @willccbb's Verifiers. Es ist ein Toolkit zum Trainieren von Agenten mit RL-Techniken. Alle Umgebungen im neuen Prime Intellect Environments Hub hängen davon ab.