Ik hoorde dat reinforcement learning alleen werkt met verifieerbare beloningen? 😛 Gefeliciteerd!!