kysyntämallit rakennettiin ihmisille, jotka iskevät API:iin muutaman kerran minuutissa... Max Mutta miljoonat agentit eivät koskaan nuku, eivät koskaan erässä, eivät koskaan odota He tekevät päättelyä jatkuvasti, kaikilla aikavyöhykkeileillä, ilman nollatoleranssia jonossa pysymiselle AWS ei pysty rakentamaan datakeskuksia tarpeeksi nopeasti ihmisten tarpeisiin. He eivät edes hinnoittele, mitä agentit tekevät tälle käyrälle Mallien päivittämisen aika on vähättelyä