Qwen3 Next cukup cepat di MLX LM terbaru (terima kasih @ivanfioravanti!). Pada M4 Max saya, 4-bit berjalan pada >70 toks/detik. Dan keadaan yang hampir konstan cukup bagus. Kecepatan dan penggunaan memori hampir tidak berubah setelah menghasilkan lebih dari 7600 token.