Qwen3.5 toimii varsin hyvin mlx-lm:ssä. Mahtavaa, että meillä on frontier-tason hybridimalli. Konteksti pitenee, mutta päättelynopeus ja muistin käyttö eivät juuri muutu. Tässä Q4 luo Space Invaders -pelin M3 Ultralla. Tuotti 4 120 tokenia nopeudella 37,6 tok/s.
Kiitos @pcuenq:lle muunnoksesta. Ja @JJJYmmm2002, @ActuallyIsaak ja @JohnMai_Dev satamaan.
50