周二的TechCrunch文章关于RL时忘记提到这个关键库:@willccbb的Verifiers。这是一个用于使用RL技术训练代理的工具包。 新Prime Intellect Environments Hub中的所有环境都依赖于它。