Bóg nie wymagałby, aby rmsnorm wymagał pełnej redukcji w d_model... nie zrobiłby nam tego...