火曜日の TechCrunch の RL に関する記事では、この重要なライブラリである @willccbb の検証者について言及するのを忘れていました。これは、RL 手法を使用してエージェントをトレーニングするためのツールキットです。 新しい Prime Intellect 環境ハブのすべての環境は、この Hub に依存しています。