Qwen3.5 fungerer ganske bra i mlx-lm. Kult at vi har en hybridmodell på grensenivå. Konteksten blir lengre, men slutningshastigheten og minnebruken endrer seg knapt. Her er Q4 som genererer et Space Invaders-spill på en M3 Ultra. Genererte 4 120 tokens med 37,6 tok/s.
Takk til @pcuenq for konverteringen. Og @JJJYmmm2002, @ActuallyIsaak og @JohnMai_Dev til havnen.
49