Рецензована версія статті Deepseek R1 у журналі Nature. Важко повірити, що минуло лише 9 місяців з моменту R1 - здається, все життя тому! «Документ оновлює препринт, випущений у січні, в якому описується, як DeepSeek доповнив стандартну велику мовну модель (LLM) для вирішення завдань міркування. У додатковому матеріалі вперше показано, скільки коштує тренування R1: еквівалент лише 294 000 доларів США. Це на додаток до 6 мільйонів доларів або близько того, які компанія, що базується в Ханчжоу, витратила на створення базового LLM, на якому побудований R1, але загальна сума все ще значно менша, ніж десятки мільйонів доларів, які, як вважається, коштували конкуруючі моделі».