1/ Mamy kryzys skalowania sprzętu. Rdzenie tensorowe GPU podwajają prędkość, ale przepustowość pamięci i jednostki matematyczne rosną w wykładniczym tempie stagnują. Twoje rdzenie uwagi czekają, podczas gdy podstawowe obliczenia się kończą. 🧵