Ouvi dizer que o aprendizado por reforço só funciona com recompensas verificáveis? 😛 Parabéns!!