🚨 Top 10 Open Model Leaderboard Update
Neue offene Modelle sind in die Text Arena eingetreten, und die Top 10 Rankings nach Anbieter haben sich für September verschoben!
🔹Qwen-3-235b-a22b-instruct von @Alibaba_Qwen hält die Krone auf Platz #1 🏆
🔹Longcat-flash-chat von @Meituan_LongCat feiert ein starkes Debüt auf Platz #5 😺
🔹Die besten offenen Modelle sind jetzt noch näher in der Punktzahl zusammengeklumpt
Nur die Top 7 offenen Modelle rangieren auch innerhalb der Top 50 insgesamt (proprietär & offen).
Siehe weitere Details zu den Aufsteigern, Bewegungen und wer im September draußen ist im Thread 🧵
Bei LMArena ist es unsere Mission, die Zuverlässigkeit von KI-Systemen zu verbessern.
Heute stellen wir ein Evaluierungsprodukt vor, um menschliche–KI-Interaktionen im großen Maßstab zu analysieren und ihre Komplexität in Erkenntnisse umzuwandeln, aus denen das Ökosystem lernen kann, um KI effektiver zu machen.
Unser KI-Evaluierungsdienst bietet Unternehmen, Modelllaboren und Entwicklern umfassende Bewertungen, die auf echtem menschlichem Feedback basieren und zeigen, wie Modelle in der Praxis tatsächlich abschneiden. 🧵👇
🚨 Leaderboard Umbruch
Seit der Hinzufügung von Seedream 4 High Res (aufgrund der großen Nachfrage) hat es bereits 3,7k Stimmen gesammelt, und die Rangliste ändert sich schnell.
🔸 Die Stimmen sind früh, aber Seedream 4 High Res von ByteDance ist jetzt mit dem legendären "Nano Banana" (Gemini 2.5 Flash Image) für Platz #1 🏆 auf der Text-zu-Bild-Rangliste gleichauf.
🔸 Es belegt auch Platz #2 für Bildbearbeitung!