热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
ARC-AGI 正在重新定义如何衡量通往 AGI 的进展——专注于推理、概括和适应性,而不是记忆或规模。
在 2025 年 NeurIPS 大会上,YC 的 @sdianahu 与 @arcprize 总裁 @GregKamradt 坐下来讨论为什么大多数 AI 基准测试失败,ARC-AGI 如何揭示当今模型的局限性,以及为什么衡量智能可能比构建智能更困难。
00:11 — ARC 奖是什么以及它存在的原因
00:38 — François Chollet 对 AGI 的定义
01:48 — ARC-AGI 实际测试的内容
02:25 — 当 LLMs 未能通过 ARC 基准测试时
03:38 — ARC-AGI 成为标准
04:49 — AI 进展中的假阳性
06:06 — ARC-AGI 的演变
08:55 — 超越准确性衡量智能
10:25 — 如果一个模型解决了 ARC-AGI,会发生什么?
热门
排行
收藏
