Tencent hat SRPO auf Hugging Face veröffentlicht Direkte Ausrichtung der vollständigen Diffusionskurve mit feingranularen menschlichen Präferenzen Durch das Fine-Tuning des FLUX1dev-Modells mit optimierter Rauschunterdrückung und online Belohnungsanpassung wird die von Menschen bewertete Realität und ästhetische Qualität um über das Dreifache verbessert Vibe-Codierung einer Text-zu-Bild-AI-App dafür in anycoder