Qwen3 Next är ganska snabb i den senaste MLX LM (tack vare @ivanfioravanti!). På min M4 Max körs 4-bitars med >70 toks/sek. Och det nästan konstanta tillståndet är ganska trevligt. Hastighet och minnesanvändning förändras knappast efter att ha genererat över 7600 tokens.