MLX LM中的新批次生成速度非常快。以下是我在M4 max上使用Qwen3 4B进行的4次同时生成: