På LMArena är vårt uppdrag att förbättra tillförlitligheten hos AI-system. Idag introducerar vi en utvärderingsprodukt för att analysera interaktioner mellan människa och AI i stor skala och omvandla deras komplexitet till insikter som ekosystemet kan lära sig av för att göra AI mer effektiv. Vår AI-utvärderingstjänst erbjuder företag, modelllabb och utvecklare omfattande utvärderingar grundade på mänsklig feedback från den verkliga världen, som visar hur modeller faktiskt presterar i praktiken. 🧵👇