Tässä on yhden rivin koodiyhteenveto MLX:ssä vuoden @thinkymachines blogikirjoituksesta LLM-päättelyn ei-determinismistä. Veikkaisin, että ero on sitä suurempi, mitä pienempi tarkkuus, koska saat suurempia vaikutuksia FP-matematiikan ei-assosiatiivisuudesta. Mielenkiintoista on, että tämä tarkoittaa, että harjoittelu alhaisella tarkkuudella (ajattele NVFP4:ää) saattaa tehdä sukupolvesta paljon herkemmän erän koolle.