Den nya batchgenerationen i MLX LM är ganska snabb. Här är 4 samtidiga generationer med Qwen3 4B på min M4 max: