週二的TechCrunch文章關於RL時忘記提到這個關鍵庫:@willccbb的Verifiers。這是一個用於使用RL技術訓練代理的工具包。 新Prime Intellect Environments Hub中的所有環境都依賴於它。