Workflow
Seek .(SKLTY)
icon
Search documents
登上《自然》!DeepSeek-R1训练方法发布
Ke Ji Ri Bao· 2025-09-18 08:39
DeepSeek-R1包含一个在人类监督下的深入训练阶段,以优化推理过程。梁文锋团队报告称,该模型使 用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。DeepSeek-R1在被展示优质的 问题解决案例后,会获得一个模板来产生推理过程,即这一模型通过解决问题获得奖励,从而强化学习 效果。团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。 在评估AI表现的数学基准测试中,DeepSeek-R1-Zero和DeepSeek-R1得分分别为77.9%和79.8%,在编程 竞赛及研究生水平的生物学、物理和化学问题上同样表现优异。 DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1 所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能力可通过纯强化学习来 提升,从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM领域研究生 水平问题等任务上,比传统训练的LLM表现更好。 ...
DeepSeek,严正声明!
Zhong Guo Ji Jin Bao· 2025-09-18 08:37
(原标题:DeepSeek,严正声明!) 中国基金报记者 晨曦 DeepSeek,被"碰瓷"! 9月17日晚间,深度求索(DeepSeek)发布声明称,近期有不法分子冒充"深度求索"公司或在职员工, 伪造工牌、营业执照等材料,在多个平台以"算力租赁""股权融资"等名义向用户收取费用实施诈骗。该 行为严重侵害用户权益,并损害公司声誉。 对此,深度求索严正声明: 1.深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2.任何冒用公司名义开展"算力租赁""融资"等行为均属违法,将依法追究其法律责任。 同时,深度求索提醒称,用户应通过公司官网(deepseek.com)及官方认证账号获取官方信息及最新动 态;官方网页、App产品目前均为免费,如需API调用服务,请前往官网开放平台进行充值。如遇可疑 情况,请通过官方邮箱联系核实,或向公安机关举报。 今年2月,深度求索曾发布"关于DeepSeek官方信息发布及服务渠道的说明",其中提到,部分与 DeepSeek有关的仿冒账号和不实信息对公众造成了误导和困扰。 深度求索强调,与DeepSeek有关的一切信息以官方账号发布为准,任何非官方账号 ...
训练成本29.4万美元,DeepSeek-R1登Nature封面,首个通过权威期刊同行评审的主流大模型获好评
3 6 Ke· 2025-09-18 07:55
DeepSeek-R1 的相关研究成果登上 Nature 封面,作为首个通过权威期刊同行评审的主流大模型,其也在技术之外,补充披露了训练成本。 9 月 17 日,DeepSeek-R1 的相关研究成果登上 Nature 封面,这一消息迅速在全球学术领域引发热烈讨论。其实相关研究成果已经于今年 1 月以预印本的 形式发表于 arXiv,但本次公开于 Nature 的意义在于其通过这一权威期刊接受了同行评审,换言之,外部专家并非只接收单向信息,而是能够在独立第 三方(编辑)的监督和管理下,通过一个协作过程提出问题并向作者团队要求更多信息,实属业内首次。 更加重要的是,不同于 1 月公开的预印本论文已经概述了研究方法以及 DeepSeek-R1 在一系列评测基准上的表现,这一正式见刊的论文中补充披露了该 模型的训练成本。据 Nature News 的报道显示,DeepSeek-R1 训练成本仅相当于 29.4 万美元,尽管 DeepSeek 已经为 R1 模型所依托的基础 LLM 投入了约 600 万美元,但成本总额仍远低于业内普遍认为的头部模型训练所需的数千万美元。 * 预印版论文地址:https://hyper ...
DeepSeek-R1 论文登上《自然》封面,通信ETF收涨1.92%
Sou Hu Cai Jing· 2025-09-18 07:50
9月18日,三大指数冲高快速回落。板块方面,旅游、CPO、芯片产业链等板块涨幅居前,多数板块下 跌,有色金属、大金融、稀土永磁等板块跌幅居前。截至收盘,沪指跌1.15%,深成指跌1.06%,创业 板指跌1.64%。ETF方面,国泰中证全指通信设备ETF(515880)收涨1.92%,成分股中,光库科技 (300620.SZ)涨15%,烽火通信(600498.SH)、长飞光纤(601869.SH)、亨通光电(600487.SH) 涨停。 消息面上,DeepSeek-R1推理模型研究论文登上了国际权威期刊《自然(Nature)》的封面。与今年1月 发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之 初的蒸馏质疑。此外,DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目 前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终于被DeepSeek打破"。 此外,华为方面预测,2035年全社会的算力总量将增长10万倍,AI存储容量需求将比2025年增长500 倍。在华为全联接大会2025上,华为轮值董事长徐直军表示,算力过去是、 ...
DeepSeek登《Nature》封面 梁文锋带队 首次回应争议
Feng Huang Wang· 2025-09-18 07:48
2025年9月17日,属于中国人工智能的又一个高光时刻来到了。DeepSeek-AI团队梁文锋及其同事在《自 然》杂志发表了关于开源模型DeepSeek-R1的研究成果,并登上当期封面。 在此,DeepSeek也首次回应"蒸馏"争议,在与审稿人的交流中,DeepSeek明确表示,R1并非通过复制 OpenAI模型生成的推理示例来学习。只是和大多数其他大语言模型一样,R1的基础模型是在网络上训 练的,因此它会吸收互联网上已有的AI生成的内容。 "低成本奇迹":从29万美元到世界舞台 在AI世界,有一个残酷的共识:顶尖大模型的门槛,从来不是算法,而是成本。OpenAI训练GPT-4,外 界估算其花费在1亿美元以上;谷歌、Anthropic、Meta也在数千万美元级别的预算上展开竞赛。资金与 算力,成了决定话语权的核心。 论文指出,大语言模型(LLM)的推理能力可以通过纯强化学习显著提升,从而减少对人工标注的依 赖。与传统训练方式相比,这一方法培养出的模型在数学解题、编程竞赛以及涉及STEM领域研究生水 平的问题上,均展现出更优的表现。 然而,DeepSeek打破了这一"潜规则"。根据研究团队在论文补充材料披露的细 ...
DeepSeek打破历史!中国AI的“Nature时刻”
Zheng Quan Shi Bao· 2025-09-18 07:29
据了解,DeepSeek本次在Nature上发表的论文较今年年初的初版论文有较大的改动,全文64页,不仅首 次披露了R1的训练成本,而且透露了更多模型训练的技术细节,包括对发布初期外界有关"蒸馏"方法 的质疑作出了正面回应,提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行了全面评 估。 其中,在训练成本方面,R1-Zero和R1都使用了512张H800GPU,分别训练了198个小时和80个小时,以 H800每GPU小时2美元的租赁价格换算,R1的总训练成本为29.4万美元(约合人民币209万元)。不到 30万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可谓实现了极大的降本。 关于R1发布最初时所受到的"蒸馏"质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽然可能包 含GPT-4生成的结果,但并非有意而为之,更没有专门的蒸馏环节。所谓"蒸馏",简单理解就是用预先 训练好的复杂模型输出的结果,作为监督信号再去训练另外一个模型。R1发布时,OpenAI称它发现 DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。 中国大模型,首登Na ...
中国大模型首登《自然》封面,AI医学的DeepSeek时刻还远吗?
Di Yi Cai Jing· 2025-09-18 07:02
在最新一期《自然》封面上,首次出现了来自中国AI科技公司DeepSeek的大模型R1。此前,全球的科技公司中仅有拿下过诺贝尔奖的DeepMind的 AlphaFold获此殊荣。 人工智能工具已经在其他科学领域展现出潜力,例如极端天气预报。自2022年底ChatGPT推出以来,生成式AI的迅猛发展在医学领域也掀起热潮。从药物 设计到医学影像,AI企业正在加速与临床应用的融合。随着中国大模型更多技术细节的披露,未来也有望推动大模型在医学领域的落地,AI医学的 DeepSeek时刻即将到来。 从药物设计到医学影像,AI企业正在加速与临床应用的融合。 "人工智能的吸引力在于它可以快速浏览分子数据库,将化合物与靶点相匹配。"一位制药领域专家对第一财经记者表示,"但这只是药物发现的第一步,还 有很多问题目前尚无法用人工智能来预测,例如药物的毒副作用。" 上述专家表示,在纸面上看起来不错的药物在临床试验中仍然有90%的失败率。"AI制药最终走向现实,其过程堪比自动驾驶汽车上路,除了解决技术算法 上的核心难题之外,还面临复杂的生物学问题以及最终走向应用时所面临的监管问题。"他说道,"这是因为人类对于自身的生物学问题仍然知之甚 ...
DeepSeek声明:防范冒用“深度求索”名义实施诈骗
Mei Ri Jing Ji Xin Wen· 2025-09-18 06:56
1.深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2.任何冒用我司名义开展"算力租赁"、"融资"等行为均属违法,我们将依法追究其法律责任。 每经AI快讯,9月17日,深度求索(DeepSeek)发布官方声明: 近期,有不法分子冒充"深度求索"(DeepSeek)官方或在职员工,伪造工牌、营业执照等材料,在多个 平台以"算力租赁"、"股权融资"等名义向用户收取费用实施诈骗。该行为严重侵害用户权益,并损害我 司声誉。 ...
DeepSeek登《Nature》封面,梁文锋带队,首次回应“蒸馏”争议
Feng Huang Wang· 2025-09-18 06:17
2025年9月17日,属于中国人工智能的又一个高光时刻来到了。DeepSeek-AI团队梁文锋及其同事在《自然》杂志发表了关于开源模型 DeepSeek- R1 的研究成果,并登上当期封面。 论文指出,大语言模型(LLM)的推理能力可以通过纯强化学习显著提升,从而减少对人工标注的依赖。与传统训练方式相比,这一方法培养出 的模型在数学解题、编程竞赛以及涉及STEM领域研究生水平的问题上,均展现出更优的表现。 在此,DeepSeek也首次回应"蒸馏"争议,在与审稿人的交流中,DeepSeek明确表示,R1并非通过复制OpenAI模型生成的推理示例来学习。只是和 大多数其他大语言模型一样,R1的基础模型是在网络上训练的,因此它会吸收互联网上已有的AI生成的内容。 "低成本奇迹":从29万美元到世界舞台 在AI世界,有一个残酷的共识:顶尖大模型的门槛,从来不是算法,而是成本。OpenAI训练GPT-4,外界估算其花费在1亿美元以上;谷歌、 Anthropic、Meta也在数千万美元级别的预算上展开竞赛。资金与算力,成了决定话语权的核心。 然而,DeepSeek打破了这一"潜规则"。根据研究团队在论文补充材料披露的细节 ...
DeepSeek发布防诈骗声明:有不法分子冒用公司名义开展“算力租赁”“融资”,将追究其法律责任
Xin Lang Ke Ji· 2025-09-18 05:53
关于防范冒用"深度求索"名义 实施诈骗的声明 DeepSeek 9月18日晚发布官方声明称近期,有不法分子冒充"深度求索"(DeepSeek)官方或在职员工, 伪造工牌、营业执照等材料,在多个平台以"算力租赁"、"股权融资"等名义向用户收取费用实施诈骗。 该行为严重侵害用户权益,并损害公司声誉。 原文声明如下: 1. 深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2. 任何冒用公司名义开展"算力租赁"、"融资"等行为均属违法,将依法追究其法律责任。 DeepSeek 提醒用户: 通过官网(deepseek.com)及官方认证账号获取官方信息及最新动态; 官方网页、App 产品目前均为免费,如需 API 调用服务请前往官网开放平台进行充值,官方收款账户 名称为"杭州深度求索人工智能基础技术研究有限公司"; 如遇可疑情况,请通过官方邮箱联系核实,或向公安机关举报。 deepseek 近期,有不法分子冒充"深度求索"(DeepSeek)官 方或在职员工,伪造工牌、营业执照等材料,在多个 平台以"算力租赁"、"股权融资"等名义向用户收 取费用实施诈骗。该行为严重侵害用户权益,并损害 ...