Recenzowana wersja artykułu Deepseek R1 w Nature. Trudno uwierzyć, że minęło tylko 9 miesięcy od R1 - wydaje się, że to wieczność temu! "Artykuł aktualizuje preprint opublikowany w styczniu, który opisuje, jak DeepSeek wzbogacił standardowy duży model językowy (LLM), aby zająć się zadaniami rozumowania. Jego materiały uzupełniające ujawniają po raz pierwszy, ile kosztowało szkolenie R1: równowartość zaledwie 294 000 USD. To dochodzi do około 6 milionów dolarów, które firma z siedzibą w Hangzhou wydała na stworzenie podstawowego LLM, na którym oparty jest R1, ale całkowita kwota jest nadal znacznie mniejsza niż dziesiątki milionów dolarów, które, jak się uważa, kosztowały modele konkurencyjne."