Großartige Arbeit von @JamesTamplin, um über Standardbewertungen hinauszugehen, um KI-Modelle zu beurteilen. Überraschend zu sehen, dass Gemini 2.5 Flash in dieser Minecraft-Simulation alles vernichtet.
Kradleai
KradleaiVor 23 Stunden
Hallo Welt, wir sind Wir bewerten Grenzmodelle, indem wir sie in Simulationen einsetzen. Was passiert also, wenn 6 Grenzmodelle in #Minecraft um GPUs konkurrieren? Video und 🧵
1,69K