Die neue Batch-Generierung in MLX LM ist ziemlich schnell. Hier sind 4 gleichzeitige Generierungen mit Qwen3 4B auf meinem M4 Max: