Pré-entraînement sous un calcul infini • Les données, et non le calcul, sont le nouveau goulot d'étranglement • Les recettes standard surajustent → corriger avec une forte régularisation (décroissance de poids 30×) • Lois d'échelle : la perte diminue de manière monotone, mieux mesurée par l'asymptote et non par un budget fixe