J'ai entendu dire que l'apprentissage par renforcement ne fonctionne qu'avec des récompenses vérifiables ? 😛 Félicitations !!