Workflow
DeepSeek
icon
Search documents
刚刚!DeepSeek梁文锋论文登上《Nature》封面了!
是说芯语· 2025-09-17 23:35
DeepSeek再度开创历史! 由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的 封面。 与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质 疑。 是说芯语转载,欢迎关注分享 星标 是说芯语 不错过任何一条消息 ▶ 泛集成电路行业最新动态 Q … 是说芯语 阐述泛集成电路行业的技术走势、热点 交流、市场应用、行业分析、产业.. 64 匾原创内容 2位朋友美味 进入公众号 不再关注 AVID 3 2位朋友读过 漫 秒题众号 · 是说 -- DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行 评审,这一空白"终于被DeepSeek打破"。 在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽 然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。DeepSeek也在补充 ...
DeepSeek梁文锋论文登上《自然》封面
第一财经· 2025-09-17 23:23
2025.09. 18 本文字数:307,阅读时长大约1分钟 作者 | 一财科技 由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。 推荐阅读 "嘎子谢孟伟"公开道歉!警方已介入 47.7 与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。 DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终 于被DeepSeek打破"。 微信编辑 | 七三 第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。 专用邮箱: bianjibu@yicai.com (注:我们会对线索进行核实。您的隐私将严格保密。) ...
DeepSeek-R1开创历史,梁文锋论文登上《自然》封面
Di Yi Cai Jing· 2025-09-17 23:09
与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了 模型发布之初的蒸馏质疑。 DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模 型都还没有经过独立同行评审,这一空白"终于被DeepSeek打破"。 本次论文正面回应了模型发布之初的蒸馏质疑。 由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期 刊《自然(Nature)》的封面。 ...
刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
机器之心· 2025-09-17 17:00
机器之心报道 机器之心编辑部 太令人意外! 却又实至名归! 最新一期的 Nature 封面,竟然是 DeepSeek-R1 的研究。 也就是今年 1 月份 DeepSeek 在 arxiv 公布的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。 这篇Nature论文通讯作者 正是梁文锋。 论文链接: https://www.nature.com/articles/s41586-025-09422-z 在封面的推荐介绍中,Nature 写到: 如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似,但 这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周的期刊中,DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入下 训练一个模型,并使其进行推理。 DeepSeek-R1 模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。结果,它学会了推 理——逐步解决问题并 ...
财经观察:中国东盟携手共创“数字未来”
Huan Qiu Shi Bao· 2025-09-16 22:42
【环球时报综合报道】编者的话: 17日-21日在广西南宁举办的第22届中国—东盟博览会(简称"东博会")以"数智赋能发展,创新引领未来"为主题,集中 展示双方在数字经济和人工智能领域的最新合作成果。当前,中国—东盟自贸区3.0版谈判已经全面完成,3.0版涵盖了九大领域,第一个就是数字经济。中 国-东盟将深化数字基础设施、跨境电商、人工智能等数智领域合作,共同培育蓝色经济、绿色经济等新增长点,推动区域产业链升级与转型。中国—东盟 合作不仅惠及双方近20亿人口,更通过推动规则对接、标准互认和数据流动,为全球数字治理提供"亚洲方案"。 随着中国-东盟自贸区3.0版将数字经济纳入合作框架,双方在AI领域的合作迎来新的机遇。这其中,广西无疑发挥着"桥头堡"的作用。梁柯告诉记者,目 前,国内很多人工智能等领域的高科技企业在进入东盟市场时,往往难以找到合适的切入点和支撑平台。南宁地理位置优越且有相关政策支持,让企业能够 更为便利地对接东盟市场。同时,企业可以将先进技术率先在广西应用和验证,继而依托这一跳板,进入并拓展东盟市场。 数字经济对接东盟需求, AI 合作开辟蓝海 中国和东盟国家不断深化在数字基础设施、数字贸易等方面 ...
X @外汇交易员
外汇交易员· 2025-09-16 06:33
腾讯集团副总裁、腾讯云总裁邱跃鹏周二宣布,腾讯已全面适配主流国产芯片。此举旨在通过软硬件协同的全栈优化策略,整合不同类型的芯片,对外提供高性价比的AI算力,以应对当前备受关注的算力供应挑战。“今天我们的GPU计算资源越来越异构,很多国产芯片在不断提升计算性能。”外汇交易员 (@myfxtrader):DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeekg官方在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。 https://t.co/ydxMxF53VL ...
OpenAI发布GPT-5-Codex:独立编码7小时,能动态调整资源,token消耗更少
Founder Park· 2025-09-16 03:24
文章转载自「新智元」,内容有调整。 今天,OpenAI 发布了专用于编程任务的新模型 GPT-5-Codex。 此次发布的 GPT-5-Codex 属于 GPT-5 的一个特殊版本,专为智能体编程( agentic coding) 重新设计。 GPT-5-Codex 将具备全面的「 双模」特长 : 简单说就是,GPT-5-Codex不仅快&而且更加可靠。 GPT-5-Codex的交互响应更灵敏,小任务几乎即时,大任务可持续执行数小时。 OpenAI内部测试可连续7小时完成大规模重构。 博客链接: https://openai.com/index/introducing-upgrades-to-codex/ 超 13000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 即时协作 : 与开发者实时配合,快速回答问题、修复小bug。 独立执行 : 能长时间自主推进复杂任务(如大规模重构、跨文件调试)。 进群后,你有机会得到: 01 根据不同任务动态调整资源, 能独立完成冗长复杂任务 首先,在SWE-bench验证和代码重构任务上,GPT-5-Codex ...
'DeepSeek is only the beginning' for #China says professor #tech
Bloomberg Television· 2025-09-15 21:00
How should we look at the Chinese economy right now. Um, still tested. I'd say resilient in some ways if you look at the macro numbers, but still tested by deflationary pressures, real estate way down.But you know what I found out this summer was that there's a real dichotomy between how good high-tech is, how really strong high-tech is going forward. Deep deepseek is really only the beginning, but how weak uh the microlevel economy is on consumption, all that. like you know they're leaning off of policy bu ...
X @Bloomberg
Bloomberg· 2025-09-15 12:47
"DeepSeek is just the beginning."Economics professor and author Keyu Jin tells @flacqua that China is "going after a drastic cost-cutting innovation" for its economic path forward https://t.co/3e1Reko1kT https://t.co/WWhtv2aGnU ...
罗永浩提议与贾国龙公开直播对质;宇树入选MIT“聪明公司”
(原标题:罗永浩提议与贾国龙公开直播对质;宇树入选MIT"聪明公司") 21世纪经济报道新质生产力研究院综合报道 早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起看看吧。 【巨头风向标】 罗永浩提议与贾国龙公开直播对质 9月14日,西贝创始人贾国龙在某个行业群内的表态截图流出。贾国龙表示:"我应对方式有错,改。做饭的围着吃饭的转,你说咋好就咋办。"并 称"罗永浩是网络黑嘴,是网络黑社会,太坏了。但他打醒了我,算变相的帮西贝进步。"9月15日凌晨消息,罗永浩针对西贝创始人贾国龙在行业 群里发言并提及自身一事发文称:"贾总,你说我是网络黑社会,我认为你是诬蔑诽谤。这次的事件,总是我说几句,你说几句,容易各说各话, 媒体转来转去也容易出现信息偏差,我们还是找一个大的网络平台直播,当面公平公正冷静理性地对一次话吧。相信这也能澄清西贝的真相,并 且对中国预制菜产业和餐饮行业的健康发展做一些贡献@西贝贾国龙。" DeepSeek、宇树科技等被MIT科技评论评为聪明公司 9月12日,《麻省理工科技评论》"50家聪明公司"最新评选结果揭晓,DeepSeek、宇树科技等明星创企 ...