🚨 Actualización de la tabla de clasificación de los 10 mejores modelos abiertos
¡Nuevos modelos abiertos han ingresado a Text Arena y las 10 mejores clasificaciones por proveedor han cambiado para septiembre!
🔹Qwen-3-235b-a22b-instruct de @Alibaba_Qwen tiene la corona en el #1 🏆
🔹Longcat-flash-chat de @Meituan_LongCat hace un fuerte debut en el #5 😺
🔹Los modelos abiertos superiores ahora están agrupados aún más cerca en puntaje
Solo los 7 mejores modelos abiertos también se ubican entre los 50 mejores en general (propietarios y abiertos).
Vea más detalles sobre los escaladores, los que se mueven y quién está fuera para septiembre en el hilo 🧵
En LMArena, nuestra misión es mejorar la confiabilidad de los sistemas de IA.
Hoy, presentamos un producto de evaluación para analizar las interacciones entre humanos e IA a escala, convirtiendo su complejidad en información de la que el ecosistema puede aprender para hacer que la IA sea más efectiva.
Nuestro servicio de evaluación de IA ofrece a las empresas, laboratorios de modelos y desarrolladores evaluaciones integrales basadas en comentarios humanos del mundo real, que muestran cómo funcionan realmente los modelos en la práctica. 🧵👇
🚨 Sacudida de la tabla de clasificación
Desde que agregó Seedream 4 High Res (según la demanda popular), ya ha recolectado 3.7k votos y la tabla de clasificación está cambiando rápidamente.
🔸 Los votos son tempranos, pero Seedream 4 High Res de ByteDance ahora está empatado con el legendario "Nano Banana" (Gemini 2.5 Flash Image) en el # 1 🏆 en la tabla de clasificación de texto a imagen.
🔸¡También ocupa el puesto #2 en edición de imágenes!