熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我們能夠重現HRM論文中關於ARC-AGI-1的強有力發現。
此外,我們進行了一系列消融實驗,以深入了解其背後的原因。
關鍵發現:
1. HRM模型架構本身(論文的核心部分)並不是一個重要因素。
2. 外部精煉循環(在論文中幾乎沒有提及)是性能的主要驅動因素。
3. 跨任務遷移學習並不是很有幫助。重要的是在你將要測試的任務上進行訓練。
4. 你可以使用更少的數據增強,特別是在推理時。
發現2和3意味著這種方法是一種*零預訓練測試時訓練*的案例,類似於Liao等人最近發表的"沒有預訓練的ARC-AGI"論文。
280.24K
熱門
排行
收藏