Tencent ga ut SRPO på Hugging Face Direkte justering av hele diffusjonsbanen med finkornet menneskelig preferanse Ved å finjustere FLUX1dev-modellen med optimalisert denoising og online belønningsjustering, forbedre dens menneskevurderte realisme og estetiske kvalitet med over 3 ganger vibe som koder en tekst til bilde AI-app for den i hvilken som helst koder