ARC-AGI 正在重新定義如何衡量通往 AGI 的進展——專注於推理、概括和適應性,而不是記憶或規模。 在 2025 年 NeurIPS 大會上,YC 的 @sdianahu 與 @arcprize 總裁 @GregKamradt 坐下來探討為什麼大多數 AI 基準測試失敗,ARC-AGI 如何揭示當今模型的局限性,以及為什麼衡量智力可能比構建智力更困難。 00:11 — ARC 獎是什麼以及為什麼存在 00:38 — François Chollet 對 AGI 的定義 01:48 — ARC-AGI 實際測試什麼 02:25 — 當 LLM 失敗於 ARC 基準測試時 03:38 — ARC-AGI 成為標準 04:49 — AI 進展中的假陽性 06:06 — ARC-AGI 的演變 08:55 — 衡量智力不僅僅是準確性 10:25 — 如果模型解決了 ARC-AGI 會發生什麼?