Tencent lanzó SRPO en Hugging Face Alineando directamente la trayectoria completa de difusión con la preferencia humana de alta resolución Al ajustar el modelo FLUX1dev con un desruido optimizado y un ajuste de recompensa en línea, mejora su realismo evaluado por humanos y la calidad estética en más de 3x codificación de ambiente de una aplicación de IA de texto a imagen para ello en anycoder