¿Escuché que el aprendizaje por refuerzo solo funciona con recompensas verificables? 😛 ¡¡Felicidades!!