DeepSeek

Search documents
梁文锋执笔的R1论文登上Nature封面!首次回应外界三大质疑
AI前线· 2025-09-18 02:28
整理|冬梅 9 月 17 日,开源 AI"顶流"DeepSeek 再次引发行业轰动。其推理模型研究论文 DeepSeek-R1,DeepSeek 创始人梁文锋以通 讯作者的名义正式发表在国际顶尖期刊《自然》(Nature)上,并登上当期封面。 这不仅标志着国产 AI 研究迈入世界舞台,也意味着大语言模型首次通过了完整的同行评审,填补了行业空白。 DeepSeek-R1 的核心突破在于,该模型无需依赖大量人工标注的思维链数据,而是借助强化学习(RL)机制,让模型在训练 中自主形成推理能力。研究团队首先基于 DeepSeek-V3 Base 构建出 R1-Zero ,通过只奖励最终预测正确性的方式,引导模 型逐渐学会生成更长、更具逻辑性的回答。随后,团队在此基础上引入多阶段训练,结合监督微调和拒绝采样,最终打造出既 具备强推理性能、又符合人类偏好的 DeepSeek-R1。 在全球开源社区中,DeepSeek-R1 已成为最受欢迎的推理模型之一。截至目前,其在 Hugging Face 平台的下载量已突破 1090 万次 。 新版论文回应质疑, 披露训练细节 与今年初的预印版相比,本次发表于《自然》的论文补充了大 ...
DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
Xin Lang Cai Jing· 2025-09-18 02:23
DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究 者。DeepSeek R1的核心创新在于采用了"纯强化学习"这一自动化试错方法,R1通过奖励模型达到正确 答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。 在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美 元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。 今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下 跌。 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究 论文,登上了国际权威期刊《自然(Nature)》的封面。 DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论 文,与今年1月未经同行评审的初版有较大差异。 在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增 ...
DeepSeek-R1登上Nature封面:朝着AI透明化迈出的可喜一步
3 6 Ke· 2025-09-18 02:02
开源人工智能(AI)的价值正获得更广泛的认可。 刚刚,DeepSeek-R1 论文以封面文章的形式登上了权威科学期刊 Nature,DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。 论文链接:https://www.nature.com/articles/s41586-025-09422-z 研究团队假设,人类定义的推理模式可能会限制模型的探索,而无限制的强化学习(RL)训练可以更好地激励大语言模型(LLM)中新推理能力的涌 现。 他们通过实验证明,LLM 的推理能力可以通过纯 RL 来提升,从而减少增强性能所需的人类输入工作量,且在数学、编程竞赛和 STEM 领域研究生水平 问题等任务上,比经传统方法训练的 LLM 表现更好。 DeepSeek-R1 推出后,得到了全球开发者的广泛好评,截至发文前,其在 GitHub 上的 star 数已经达到了 91.1k。 在一篇同期发表的观点与评论文章中,卡内基梅隆大学助理教授Daphne Ippolito和他的博士生张益铭(现为 Anthropic 的 LLM 安全和对齐研究员)评价 道: "DeepSeek-R1 已从一个强大但不透明的解决方案寻找者 ...
DeepSeek登上Nature封面,梁文锋带队回应质疑,R1训练真29.4万美金
3 6 Ke· 2025-09-18 01:32
刚刚,DeepSeek-R1登上了Nature封面! 今年1月,DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文发布,如今成功登上全球顶刊封面。 通讯作者梁文锋带队,用RL为大模型推理能力开辟了全新路径。 论文地址:https://www.nature.com/articles/s41586-025-09422-z 值得一的是,补充材料首次公开了R1训练成本——294000美元,数字低到惊人。 即便是加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。 在封面推荐中,Nature毫不吝啬地赞扬了DeepSeek-R1的成就。 开源之后,R1在Hugging Face成为最受欢迎的模型,下载量破1090万次。关键是,它是全球首个经过同行评审的主流大模型。 | Training Costs | DeepSeek-R1-Zero | SFT data creation | DeepSeek-R1 | Total | | --- | --- | --- | --- | --- ...
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万
量子位· 2025-09-18 00:51
就在最新的Nature新刊中,DeepSeek一举成为 首家 登上《Nature》封面的中国大模型公司,创始人 梁文锋 担任通讯作者。 henry 发自 凹非寺 量子位 | 公众号 QbitAI Nature封面认证!DeepSeek R1成果,又拿下了最新殊荣。 纵观全球,之前也只有极少数如DeepMind者,凭借AlphaGo、AlphaFold有过类似荣誉。 Nature版本的R1论文不仅 首次 披露了R1的训练成本——仅约 29.4 万美元(折合人民币约 208 万),还进一步补充了包括模型训练所使用 的数据类型及安全性的技术细节。 澄清训练细节 评审该论文的Hugging Face机器学习工程师Lewis Tunstall表示,R1是 首个经历同行评审的大型语言模型 ,这是一个非常值得欢迎的先 例。 而俄亥俄州立大学人工智能研究员Huan Sun更是盛赞R1 ,称其自发布以来,几乎影响了所有在大语言模型中使用强化学习的研究。 截至发文前,其数据如下: 不过也是因为DeepSeek,中国AI公司的下一篇工作,恐怕已经不再满足于 CVPR、ICLR、ICML这些AI顶会了, 是不是得对齐Nature、S ...
梁文锋论文登上《自然》封面
财联社· 2025-09-18 00:49
9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然》的封面。 与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。 DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这 一空白"终于被DeepSeek打破"。 下载财联社APP获取更多资讯 准确 快速 权威 专业 7x24h电报 头条新闻 VIP资讯 实时盯盘 ...
DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
3 6 Ke· 2025-09-18 00:45
太令人意外! 却又实至名归! 最新一期的 Nature 封面,竟然是 DeepSeek-R1 的研究。 也就是今年 1 月份 DeepSeek 在 arxiv 公布的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。这篇Nature论文 通讯作者正是梁文锋。 论文链接: https://www.nature.com/articles/s41586-025-09422-z 在封面的推荐介绍中,Nature 写到: 如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似,但 这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周的期刊中,DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入 下训练一个模型,并使其进行推理。 DeepSeek-R1 模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。结果,它学会了推 理——逐步解决问题并揭示这些步骤——更有可能得出正确 ...
梁文锋论文登上《自然》封面
Mei Ri Jing Ji Xin Wen· 2025-09-18 00:42
(文章来源:每日经济新闻) 与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了 模型发布之初的蒸馏质疑。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价 道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终于被DeepSeek打破"。 由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期 刊《自然(Nature)》第645期的封面。 ...
8点1氪:西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 00:19
西贝门店负责人介绍称涉事顾客使用过的筷子、餐具、桌布等已全部丢弃。 整理 |Purple 点击上方【36氪随声听】,一键收听大公司热门新闻。听完音频记得添加进入 【我的小程序】 中哟! 西贝回应"公筷喂狗"事件:涉事餐具已全部丢弃 近日,陈先生带着孩子去一家亲子主题的西贝餐厅就餐。用餐过程中,两名顾客带着一只宠物狗进入餐厅,不仅将狗放在餐椅上,待菜品上桌后,还直接 用餐厅提供的筷子夹菜喂狗。为此,陈先生对用餐环境安全提出质疑。 该餐厅负责人在受访时表示,餐厅有"禁止宠物入内"的规定,但因客流高峰未能及时发现顾客带狗进店。负责人介绍,涉事顾客使用过的筷子、餐具、桌 布等已全部丢弃,未进入清洗流程;同时,当天夜间对餐厅前厅、厨房的所有餐具、厨具进行了全面消杀。 温州市市场监督管理局相关工作人员表示,目前国家及温州市层面暂无法律依据认定"商家允许宠物入内"这一行为违规;而顾客用餐厅筷子喂狗属于个人 行为,若未对其他顾客造成直接损害,暂不涉及行政处罚。(第一财经) 美联储宣布降息25个基点 当地时间9月17日,美联储最新的联邦公开市场委员会(FOMC)货币政策会议纪要显示,美联储决定将联邦基金利率目标区间下调25个基 ...
刚刚,梁文锋发Nature了
3 6 Ke· 2025-09-17 23:43
昨晚,DeepSeek再度开创历史! 智东西9月18日报道,9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自 然(Nature)》的封面。 DeepSeek-R1论文首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,启发全球AI研究者;这一模型还成为全球最受欢迎的 开源推理模型,Hugging Face下载量超1090万次。此番获得《自然》的认证,可谓是实至名归。 与此同时,DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。《自然》在社论中高度评价道:几乎所有主流的大模型都还没有经过 独立同行评审,这一空白"终于被DeepSeek打破"。 《自然》认为,在AI行业中,未经证实的说法和炒作已经"司空见惯",而DeepSeek所做的一切,都是"迈向透明度和可重复性的可喜一步"。 《自然》杂志封面标题:自助——强化学习教会大模型自我改进 发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异,披露了更多模型训练的细节,并正面回应了模型 发布之初的蒸馏质疑。 | https:// ...