我們能夠重現HRM論文中關於ARC-AGI-1的強有力發現。 此外,我們進行了一系列消融實驗,以深入了解其背後的原因。 關鍵發現: 1. HRM模型架構本身(論文的核心部分)並不是一個重要因素。 2. 外部精煉循環(在論文中幾乎沒有提及)是性能的主要驅動因素。 3. 跨任務遷移學習並不是很有幫助。重要的是在你將要測試的任務上進行訓練。 4. 你可以使用更少的數據增強,特別是在推理時。 發現2和3意味著這種方法是一種*零預訓練測試時訓練*的案例,類似於Liao等人最近發表的"沒有預訓練的ARC-AGI"論文。
280.24K