熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
ARC-AGI 正在重新定義如何衡量通往 AGI 的進展——專注於推理、概括和適應性,而不是記憶或規模。
在 2025 年 NeurIPS 大會上,YC 的 @sdianahu 與 @arcprize 總裁 @GregKamradt 坐下來探討為什麼大多數 AI 基準測試失敗,ARC-AGI 如何揭示當今模型的局限性,以及為什麼衡量智力可能比構建智力更困難。
00:11 — ARC 獎是什麼以及為什麼存在
00:38 — François Chollet 對 AGI 的定義
01:48 — ARC-AGI 實際測試什麼
02:25 — 當 LLM 失敗於 ARC 基準測試時
03:38 — ARC-AGI 成為標準
04:49 — AI 進展中的假陽性
06:06 — ARC-AGI 的演變
08:55 — 衡量智力不僅僅是準確性
10:25 — 如果模型解決了 ARC-AGI 會發生什麼?
熱門
排行
收藏
