一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

我們能夠重現HRM論文中關於ARC-AGI-1的強有力發現。此外，我們進行了一系列消融實驗，以深入了解其背後的原因。關鍵發現： 1. HRM模型架構本身（論文的核心部分）並不是一個重要因素。 2. 外部精煉循環（在論文中幾乎沒有提及）是性能的主要驅動因素。 3. 跨任務遷移學習並不是很有幫助。重要的是在你將要測試的任務上進行訓練。 4. 你可以使用更少的數據增強，特別是在推理時。發現2和3意味著這種方法是一種*零預訓練測試時訓練*的案例，類似於Liao等人最近發表的"沒有預訓練的ARC-AGI"論文。

280.24K