Flott arbeid av @JamesTamplin for å gå utover standard vurderinger for å bedømme AI-modeller. Overraskende å se Gemini 2.5 Flash utslette på denne minecraft-simuleringen.
Kradleai
Kradleai9. sep., 02:53
Hei verden, vi er Vi velger grensemodeller ved å sette dem inn i simuleringer. Så hva skjer når 6 frontier-modeller konkurrerer i #Minecraft om GPUer? Video og 🧵
1,93K