Tencent выпустила SRPO на Hugging Face Прямое выравнивание полной траектории диффузии с тонкой настройкой человеческих предпочтений Путем дообучения модели FLUX1dev с оптимизированным подавлением шума и онлайн-корректировкой вознаграждения, улучшить ее оцененную людьми реалистичность и эстетическое качество более чем в 3 раза кодирование атмосферы текстового изображения AI приложения для этого в anycoder