Gott würde nicht verlangen, dass rmsnorm eine vollständige Reduktion über d_model erfordert... das würde er uns nicht antun...