在無限計算下進行預訓練 • 數據,而不是計算,是新的瓶頸 • 標準配方過擬合 → 通過強正則化修復(30× 權重衰減) • 擴展法則:損失單調減少,最好通過漸近線而不是固定預算來衡量