《自然》期刊中經過同行評審的Deepseek R1論文版本。 很難相信自R1發佈以來僅僅過去了9個月——感覺就像是很久以前的事了! “這篇論文更新了1月份發佈的預印本,描述了DeepSeek如何增強標準的大型語言模型(LLM)以應對推理任務。其補充材料首次揭示了R1訓練的成本:相當於僅僅294,000美元。這還不包括位於杭州的公司為構建R1所基於的基礎LLM花費的約600萬美元,但總金額仍然遠低於競爭對手模型的數千萬美元成本。”