Un excellent travail de @JamesTamplin pour aller au-delà des évaluations standard afin de juger les modèles d'IA. Il est surprenant de voir Gemini 2.5 Flash tout détruire dans cette simulation de Minecraft.
Kradleai
Kradleai9 sept., 02:53
Bonjour le monde, nous sommes Nous évaluons les modèles de pointe en les plaçant dans des simulations. Que se passe-t-il lorsque 6 modèles de pointe s'affrontent dans #Minecraft pour des GPU ? Vidéo et 🧵
1,93K