Pré-treinamento sob computação infinita • Dados, não computação, são o novo gargalo • Receitas padrão superajustam → corrigir com forte regularização (30× decaimento de peso) • Leis de escalonamento: a perda diminui monotonamente, melhor medida pela assíntota e não por orçamento fixo