《自然》期刊中经过同行评审的Deepseek R1论文版本。 很难相信自R1发布以来仅仅过去了9个月——感觉就像是很久以前的事了! “这篇论文更新了1月份发布的预印本,描述了DeepSeek如何增强标准的大型语言模型(LLM)以应对推理任务。其补充材料首次揭示了R1训练的成本:相当于仅仅294,000美元。这还不包括位于杭州的公司为构建R1所基于的基础LLM花费的约600万美元,但总金额仍然远低于竞争对手模型的数千万美元成本。”