Workflow
DeepSeek登上Nature封面,梁文锋带队回应质疑,R1训练真29.4万美金
Seek .Seek .(US:SKLTY) 3 6 Ke·2025-09-18 01:32

刚刚,DeepSeek-R1登上了Nature封面! 今年1月,DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文发布,如今成功登上全球顶刊封面。 通讯作者梁文锋带队,用RL为大模型推理能力开辟了全新路径。 论文地址:https://www.nature.com/articles/s41586-025-09422-z 值得一的是,补充材料首次公开了R1训练成本——294000美元,数字低到惊人。 即便是加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。 在封面推荐中,Nature毫不吝啬地赞扬了DeepSeek-R1的成就。 开源之后,R1在Hugging Face成为最受欢迎的模型,下载量破1090万次。关键是,它是全球首个经过同行评审的主流大模型。 | Training Costs | DeepSeek-R1-Zero | SFT data creation | DeepSeek-R1 | Total | | --- | --- | --- | --- | --- ...