@JamesTamplin 的出色工作,超越了标准评估来评判 AI 模型。 令人惊讶的是,Gemini 2.5 Flash 在这个 Minecraft 模拟中表现得如此出色。
Kradleai
Kradleai23 小时前
你好,世界,我们正在 通过将前沿模型放入模拟中来评估它们。 那么,当6个前沿模型在#Minecraft中竞争GPU时会发生什么? 视频和🧵
1.69K