Dios no haría que rmsnorm requiriera una reducción completa sobre d_model... no nos haría eso...