Wstępne szkolenie przy nieskończonym obliczeniu • Dane, a nie obliczenia, są nowym wąskim gardłem • Standardowe przepisy przeuczają → napraw to silną regularyzacją (30× spadek wagi) • Prawa skalowania: strata maleje monotonicznie, najlepiej mierzona przez asymptotę, a nie stały budżet