Na LMArena, nossa missão é melhorar a confiabilidade dos sistemas de IA.
Hoje, estamos introduzindo um produto de avaliação para analisar as interações entre humanos e IA em escala, transformando sua complexidade em insights com os quais o ecossistema pode aprender para tornar a IA mais eficaz.
Nosso serviço de avaliação de IA oferece às empresas, laboratórios de modelos e desenvolvedores avaliações abrangentes baseadas em feedback humano do mundo real, mostrando como os modelos realmente funcionam na prática. 🧵👇
🚨 Mudança na tabela de classificação
Desde a adição do Seedream 4 High Res (com base na demanda popular), ele já coletou 3,7 mil votos e a tabela de classificação está mudando rapidamente.
🔸 Os votos são antecipados, mas Seedream 4 High Res da ByteDance agora está empatado com o lendário "Nano Banana" (Gemini 2.5 Flash Image) para # 1 🏆 na tabela de classificação Text-to-Image.
🔸Ele também ocupa a posição #2 em Edição de Imagens!
🚨Atualização do novo modelo antes do fim de semana 📣
Por demanda popular, adicionamos uma versão de "alta resolução" do Seedream 4 que suporta uma saída em dimensões 4096×4096.
Veremos como esta versão do Seedream 4 se compara a todos os outros modelos de geração de imagens em breve.
🚨 Atualização da tabela de classificação:
Com mais de 43 mil votos coletados, a comunidade se manifestou!
🥈 Seedream 4 da ByteDance chegou ao #2 na Tabela de Classificação de Edição de Imagens
🔸 Também é classificado como #5 para Text-to-Image
Prompts e votos reais em escala ilustram intervalos de confiança mais nítidos e classificações mais confiáveis. Gemini 2.5 Flash Image (nano-banana) continua no topo de ambos os gráficos.