Vertaisarvioitu versio Deepseek R1 -paperista Naturessa. Vaikea uskoa, että R1:stä on kulunut vain 9 kuukautta - tuntuu kuin elämä sitten! "Paperi päivittää tammikuussa julkaistua preprintiä, jossa kuvataan, kuinka DeepSeek täydensi tavallista suurta kielimallia (LLM) päättelytehtävien ratkaisemiseksi. Sen lisämateriaali paljastaa ensimmäistä kertaa, kuinka paljon R1:n kouluttaminen maksoi: vain 294 000 dollaria. Tämä tulee sen noin 6 miljoonan dollarin lisäksi, jonka Hangzhoussa sijaitseva yritys käytti R1:n perus-LLM:n valmistamiseen, mutta kokonaissumma on silti huomattavasti pienempi kuin kymmenet miljoonat dollarit, jotka kilpailevien mallien uskotaan maksaneen."