Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Qwen
Modelos de cimentación abiertos para AGI.
LightX2V ofrece soporte Day-0 para Qwen-Image-Edit-2511 — combinando un 47% de aceleración del framework con CFG + destilación en 4 pasos (↓25× de cálculo) para una enorme aceleración de extremo a extremo del 42,55× ¡Muchas ⚡️ gracias a @XHPlus_

Ruihao Gonghace 10 horas
🚀 ¡42,55x de aceleración!
¡LightX2V ofrece soporte desde el Día 0 para @Alibaba_Qwen nuevo Qwen-Image-Edit-2511!
🔥 Aceleración del marco del 47%
⚡️ Destilación CFG+4 pasos (cálculo ↓25x)
📈 42,55 veces la aceleración total
Repo:
Modelo:

73
🚀 Presentamos Qwen-Image-Edit-2511 — una mejora importante respecto a 2509, que ofrece una consistencia significativamente mayor y una edición de imagen real más potente.
✨ Novedades en 2511:
👥 Mayor coherencia entre varias personas para fotos de grupo y escenas complejas
🧩 LoRAs populares integrados en la comunidad — no se requiere ajuste adicional
💡 Generación mejorada de diseño industrial y de productos
🔒 Reducción del deriva de imagen con una coherencia de personajes e identidad notablemente mejorada
📐 Mejoró el razonamiento geométrico, incluyendo líneas de construcción y ediciones estructurales
Desde ediciones de retratos que preservan la identidad hasta fusiones multipersona de alta fidelidad y flujos de trabajo prácticos de ingeniería y diseño, 2511 lleva la edición de imágenes al siguiente nivel.
👉 Pruébalo ahora:
🎨 Qwen Chat (Edición de la imagen):

61
¡Encantado de colaborar con SGLang en la Repetición de Rutas de Despliegue (R3)—¡ya en directo! 🎉

LMSYS Org23 dic, 07:42
SGLang + Miles: ¡La repetición de rutas de despliegue (R3) ya está activa! 🎉
¡Nos complace anunciar que SGLang y Miles ahora soportan Rollout Routing Replay (R3) para un entrenamiento estable de aprendizaje por refuerzo en modelos MoE.
El entrenamiento de modelos MoE con RL ha sido notoriamente inestable, lo que a menudo ha llevado a un colapso catastrófico. ¿El problema? Inconsistencia en el enrutamiento entre los motores de inferencia y de entrenamiento. R3 soluciona esto registrando decisiones de enrutamiento expertas durante la inferencia y reproduciéndolas durante el entrenamiento.
El impacto es significativo: redujeron drásticamente la discrepancia entre entrenamiento e inferencia al reutilizar decisiones de enrutamiento de inferencia, evitando el colapso del entrenamiento. R3 tiene soporte completo de entrenamiento distribuido con DataParallel Attention y todas las estrategias de paralelismo; los modelos soportados incluyen Qwen3-30B-A3B, deepseek_v2, etc.
¡Pruébalo y cuéntanos tus resultados! 🚀

68
Populares
Ranking
Favoritas
