ARC-AGI sta ridefinendo il modo di misurare i progressi verso l'AGI, concentrandosi sul ragionamento, sulla generalizzazione e sull'adattabilità invece che sulla memorizzazione o sulla scala. Al NeurIPS 2025, @sdianahu di YC ha incontrato il Presidente di @arcprize @GregKamradt per scoprire perché la maggior parte dei benchmark AI fallisce, come ARC-AGI rivela i limiti dei modelli odierni e perché misurare l'intelligenza potrebbe essere più difficile che costruirla. 00:11 — Cos'è il Premio ARC e perché esiste 00:38 — La definizione di AGI di François Chollet 01:48 — Cosa testa realmente ARC-AGI 02:25 — Quando gli LLM hanno fallito il benchmark ARC 03:38 — ARC-AGI diventa lo standard 04:49 — Falsi positivi nei progressi dell'AI 06:06 — L'evoluzione di ARC-AGI 08:55 — Misurare l'intelligenza oltre la semplice accuratezza 10:25 — Cosa succede se un modello risolve ARC-AGI?