Świetna praca @JamesTamplin, aby wyjść poza standardowe oceny w ocenie modeli AI. Zaskakujące, że Gemini 2.5 Flash zdominował tę symulację Minecraft.
Kradleai
Kradleai9 wrz, 02:53
Witaj świecie, jesteśmy Oceniamy modele frontierowe, umieszczając je w symulacjach. Co się dzieje, gdy 6 modeli frontierowych rywalizuje w #Minecraft o GPU? Wideo i 🧵
2,03K