бог не стал бы заставлять rmsnorm требовать полного уменьшения по d_model... он бы не сделал этого с нами...