Chúa sẽ không bắt rmsnorm yêu cầu một sự giảm hoàn toàn trên d_model... Ngài sẽ không làm điều đó với chúng ta...