В статье TechCrunch во вторник о RL не упомянули эту ключевую библиотеку: Verifiers от @willccbb. Это набор инструментов для обучения агентов с использованием техник RL. Все среды в новом Центре Сред Prime Intellect зависят от нее.