我们能够重现HRM论文中关于ARC-AGI-1的强有力发现。 此外,我们进行了系列消融实验,以深入了解其背后的原因。 关键发现: 1. HRM模型架构本身(论文的核心部分)并不是一个重要因素。 2. 外部精炼循环(在论文中几乎没有提及)是性能的主要驱动因素。 3. 跨任务迁移学习并不是很有帮助。重要的是在你将要测试的任务上进行训练。 4. 你可以使用更少的数据增强,特别是在推理时。 发现2和3意味着这种方法是一种*零预训练测试时训练*的案例,类似于Liao等人最近发表的"没有预训练的ARC-AGI"论文。
280.23K