Seek .(SKLTY)
Search documents
2026年美中AI市场竞争态势与DeepSeek的突围-英文版
Sou Hu Cai Jing· 2026-01-22 18:44
报告由兰德公司(RAND)发布,聚焦 2024 年 4 月至 2025 年 8 月美中大型语言模型(LLM)的全球竞争格局,通过分析 135 个国家的网站流量数据,探究 市场动态、DeepSeek R1 的突围影响及 adoption 驱动因素,为理解中美 AI 霸权争夺提供关键洞察。 报告核心发现显示,全球 LLM 市场增长迅猛,期间主要平台月访问量从 24 亿次增至 82 亿次,美国模型持续占据主导地位,2025 年 8 月全球市场份额达 93%。然而,2025 年 1 月中国 LLM 模型 DeepSeek R1 的推出打破了市场格局,引发 "DeepSeek 颠覆效应":两个月内中国 LLM 平台访问量激增 460%,全 球市场份额从 3% 跃升至 13%,且未分流其他中国模型流量,反而带动整体市场扩张。截至 2025 年 8 月,中国模型在 30 个国家的渗透率超 10%,11 个国 家市场份额达 20%,增长主要集中在发展中国家及与中国政治经济联系紧密的国家。 Markets 在 adoption 驱动因素研究中,报告分析了定价、多语言支持和 AI 外交三大维度。定价方面,中国模型 API 费用仅 ...
大摩眼中的DeepSeek:以存代算、以少胜多
3 6 Ke· 2026-01-22 09:09
DeepSeek正在改写AI的扩展法则:下一代AI的决胜点不再是单纯堆砌更大的GPU集群,而是通过更聪明的混合架构,用性价比更高的DRAM置换 稀缺的HBM资源。 据追风交易台消息,摩根士丹利1月21日发布的最新研报显示,DeepSeek正在通过一种名为"Engram"的创新模块,改变大语言模型的构建方式。 其核心突破在于将存储与计算分离,通过引入"条件记忆"(Conditional Memory)机制,大幅减少了对昂贵且紧缺的高带宽内存(HBM)的需 求,转而利用成本更低的普通系统内存(DRAM)来处理复杂的推理任务。 DeepSeek的解决方案是引入"条件记忆"(Conditional Memory)原则,即Engram模块。 这一架构的核心在于将静态模式存储与动态推理分离。DeepSeek不再将所有信息一次性加载到昂贵的HBM中,而是将模型的"图书馆"或"字 典"(静态知识)卸载到CPU或系统内存(DRAM)中,仅在需要时进行检索。 大摩分析师在报告中强调:"DeepSeek将'条件记忆'与计算分离,为大语言模型(LLM)解锁了新的效率水平。Engram是一种在不通过重载HBM 的情况下,高效'查找'基 ...
大摩眼中的DeepSeek:以存代算、以少胜多!
Hua Er Jie Jian Wen· 2026-01-22 02:48
DeepSeek正在改写AI的扩展法则:下一代AI的决胜点不再是单纯堆砌更大的GPU集群,而是通过更聪明的混合架构,用性价比更高的DRAM置换 稀缺的HBM资源。 据追风交易台消息,摩根士丹利1月21日发布的最新研报显示,DeepSeek正在通过一种名为"Engram"的创新模块,改变大语言模型的构建方式。 其核心突破在于将存储与计算分离,通过引入"条件记忆"(Conditional Memory)机制,大幅减少了对昂贵且紧缺的高带宽内存(HBM)的需 求,转而利用成本更低的普通系统内存(DRAM)来处理复杂的推理任务。 大摩分析师Shawn Kim及其团队认为,DeepSeek展示了如何"少花钱多办事"(Doing More With Less)的哲学。这种将存储与计算分离的技术路 径,不仅缓解了中国面临的AI算力约束,更向市场证明了高效的混合架构才是AI的下一个前沿。 这一被大摩重点关注的架构,源自DeepSeek创始人梁文锋团队与北大合作者在1月13日发布的重磅论文《Conditional Memory via Scalable Lookup》。在这篇论文中,团队首次提出了"Engram"(印迹)模块。 ...
科技 - DeepSeek:以更少资源实现更多价值Tech Bytes-DeepSeek – Doing More With Less
2026-01-22 02:44
January 21, 2026 06:57 AM GMT Tech Bytes | Asia Pacific M Idea DeepSeek – Doing More With Less DeepSeek's latest innovation of Engram module reduces HBM constraints and infrastructure costs via decoupling storage from compute. This could address China's AI computing constraints, and demonstrates that the next AI frontier may not be simply bigger models but efficient hybrid architectures. More mileage out of scarce GPU resources. DeepSeek decoupling "Conditional Memory" from compute (Engram) unlocks a new le ...
DeepSeek新模型将至?创业板人工智能ETF南方(159382)上涨2.21%,国产大模型迭代加速,2026年AI成长确定性增强
Xin Lang Cai Jing· 2026-01-22 02:41
截至2026年1月22日 10:13,创业板人工智能ETF南方(159382)上涨2.21%,成交3496.02万元。跟踪指数 创业板人工智能指数成分股深信服上涨10.83%,万兴科技上涨4.84%,润泽科技上涨4.72%,天孚通 信,蓝色光标等个股跟涨。 消息面上,1月20日,国新办举行新闻发布会介绍2025年工业和信息化发展成效。相关负责人表示,目 前人工智能(AI)已渗透领航级智能工厂70%以上的业务场景,沉淀了超6000个垂直领域模型,带动 1700多项关键智能制造装备和工业软件规模化应用,形成一批具备感知、决策和执行能力的工业智能 体,推动智能制造从自动化向自主化改进。 据业内消息,在DeepSeek-R1发布一周年之际,新模型"MODEL1"的项目名在开源社区悄然出现。近 日,DeepSeek官方在GitHub更新了一系列FlashMLA代码,项目文件有数十处都提到了此前未公开 的"MODEL1"大模型标识符。 国联民生证券指出,2026年全球大模型仍处于加速迭代周期,中国AI发展具备强劲竞争力。国内方 面,DeepSeek有望在春节期间发布新一代模型,同时头部科技企业资本支出持续提升,为模型能力 ...
DeepSeek新模型曝光;AI产业链业绩兑现丨新鲜早科技
2 1 Shi Ji Jing Ji Bao Dao· 2026-01-22 02:30
Group 1: Technology Developments - DeepSeek has updated its GitHub repository, revealing a new model architecture "MODEL1," which is expected to be more efficient and suitable for edge devices compared to its predecessor DeepSeek-V3.2 [2] - Longji Technology announced significant progress in Co-packaged Optics (CPO) technology, with successful customer sample deliveries and testing, addressing the growing demand for high-bandwidth, low-latency optical interconnects [11] - Shanghai Yiyou Intelligent Control Technology has launched its first automated production line for robot joints in Zhangjiang, aiming to meet the increasing demand and reduce costs for humanoid robots [10] Group 2: Financial Performance and Projections - Moole Technology expects a net loss of 950 million to 1.06 billion yuan for 2025, despite launching a leading GPU product and experiencing revenue growth due to the AI industry's expansion [17] - Demingli anticipates a net profit of 650 million to 800 million yuan for 2025, representing a year-on-year increase of 85.42% to 128.21%, driven by advancements in storage solutions and AI demand [18] - Tianfu Communication projects a net profit of 1.881 billion to 2.150 billion yuan for 2025, reflecting a growth of 40% to 60% due to the accelerating AI industry and global data center construction [19] Group 3: Regulatory and Market Responses - The European Union plans to phase out "high-risk suppliers" in critical sectors, interpreted as targeting Chinese tech firms like Huawei, which has expressed concerns over the fairness of such regulations [2] - Pinduoduo was fined 100,000 yuan for failing to report tax information as required, highlighting regulatory scrutiny on internet platform companies [4] - Zhiyu Technology announced a temporary limit on the sale of its GLM Coding Plan due to high demand and resource constraints, reducing daily sales to 20% of current levels [3]
西贝获新一轮融资,新荣记张勇等入股;马斯克与奥特曼互喷;DeepSeek新模型曝光;黄仁勋:AI时代蓝领更吃香;俞敏洪开办“退休俱乐部”
Sou Hu Cai Jing· 2026-01-22 02:27
如图所示,你如何评价?欢迎留言区讨论... 早安,艾瑞巴蒂(手动问好),一起来看今天的早报: 【黑马高调早报】第3054期 更多创业内容请访问www.iheima.com Fast Reading 今日头条 工信部:应建立新能源汽车产品运行安全状态监测平台 1月21日,工信部修订公布《道路机动车辆生产企业准入审查要求》和《道路机动车辆产品准入审查要求》,自2027年1月1日起施行。其中指出,新能源 汽车及新能源特种作业车底盘企业应满足相适应的新能源汽车及新能源特种作业车底盘产品安全保障机制要求,主要包括:应建立新能源汽车产品运行安 全状态监测平台,按照与用户的协议,对已销售的全部新能源汽车(含底盘)的运行安全状态进行监测,直至汽车停止使用或报废。 风暴中的西贝完成新一轮融资,新荣记张勇、蚂蚁集团前CEO胡晓明加持 在预制菜舆论风波与门店调整背景下,西贝餐饮集团于20日完成A轮融资,投资方包括台州新荣泰投资、呼和浩特市集体共创企业管理中心等,具体金额 未披露。 此次融资使西贝注册资本从8990.29万元增至10168.01万元,增幅13.1%,股东结构同步调整。 值得注意的是,新投资方中台州新荣泰投资由新荣记创 ...
【钛晨报】住建部:有序搭建房地产开发、融资、销售等基础制度;DeepSeek AI新模型:搭载 MODEL1 全新架构,最快2月上线;财政部:在武汉天河国际机场等41个口岸各新设1家口岸进境免税店
Sou Hu Cai Jing· 2026-01-21 23:58
【钛媒体综合】据新华社,住房城乡建设部党组书记、部长倪虹表示,房地产高质量发展的关键,是加快转型升级。我们将重点抓好两方面工作。 一是有序推动"好房子"建设。近几年,住房城乡建设部坚持政府、企业、社会多方协同,从标准、设计、材料、建造、运维等五个方面,全链条推进"好房 子"建设,这项工作已经起步成势。去年,新版《住宅项目规范》颁布实施,有14项提升。近日印发的关于提升住房品质的意见对"好房子"建设作出全面部 署。住房城乡建设部将指导各地抓好落实,继续围绕好标准、好设计、好材料、好建造、好运维建设"好房子",既把新房子建成"好房子",也把老房子逐步 改造成"好房子",带动产业链升级,以安全、舒适、绿色、智慧的"好房子"供给,满足人民群众多样化住房需求。 二是加快构建房地产发展新模式。牢牢抓住让人民群众安居这个基点,坚持政策支持和改革创新并举,推动建立"人、房、地、钱"要素联动机制,确保新旧 模式转换平稳有序。下一步,重点是有序搭建房地产开发、融资、销售等基础制度。 在房地产开发上,做实项目公司制,项目公司依法行使独立法人权利,企业总部履行投资人责任,严禁企业总部在项目交付前违规抽挪项目公司资金、抽逃 出资或提前 ...
DeepSeek新模型曝光?“MODEL1”现身开源社区
Shang Hai Zheng Quan Bao· 2026-01-21 21:31
恰逢DeepSeek-R1模型发布一周年,DeepSeek新模型"MODEL1"现身开源社区。 1月12日,DeepSeek在github上发表新论文,文章由DeepSeek与北京大学合作完成,作者中有梁文锋署名。文章指出, Transformer架构缺乏原生的知识查找机制,迫使它们通过计算低效地模拟检索。为此,DeepSeek提出了条件记忆 (conditional memory),并给出了实现方案Engram模块。DeepSeek称,该模块不仅有助于知识检索,同时在一般推理和代 码/数学领域方面取得了更大的进步。 在业内看来,梁文锋旗下私募幻方量化较高的收益率,为DeepSeek的研发提供了更多支持。公开资料显示,幻方量化2025 年的收益均值达56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以73.51%收益均值登顶的灵均投 资。目前,幻方量化管理规模已超700亿元。 在某些文件中,"MODEL 1"与已知的现有模型"V32"(即DeepSeek-V3.2)并列提及。行业分析认为,"MODEL1"或许代表 一个不同于现有架构的新模型,可能正是DeepSeek还未对外发布的下一代模型( ...
DeepSeek新模型“MODEL1”曝光
Di Yi Cai Jing Zi Xun· 2026-01-21 09:05
Core Insights - The article discusses the emergence of a new model named "MODEL1" from DeepSeek, coinciding with the one-year anniversary of the DeepSeek-R1 release, indicating potential advancements in AI model architecture [2][6]. Group 1: Model Development - "MODEL1" has been referenced in the updated FlashMLA code on GitHub, suggesting it may represent a new model distinct from the existing "V32" architecture [2][3]. - There are differing opinions in the industry regarding whether "MODEL1" is a version 4 model or an advanced inference model, with some developers speculating it could be the ultimate version of the V3 series [2][5]. - Key technical differences between "MODEL1" and "V32" include variations in key-value (KV) cache layout, sparsity handling, and support for FP8 data format decoding, indicating targeted design for memory optimization and computational efficiency [5]. Group 2: Anticipated Release and Features - The structure of the model files suggests that "MODEL1" is nearing completion or inference deployment, awaiting final weight freezing and testing validation, which implies a forthcoming launch [5]. - There are expectations for DeepSeek to release its next flagship model, DeepSeek V4, in February, with preliminary tests indicating it may surpass other top models in programming capabilities [6]. - Recent technical papers from DeepSeek introduce new training methods and an AI memory module, hinting that these innovations may be integrated into the upcoming model [6]. Group 3: Industry Impact - The DeepSeek-R1 model has been recognized as the most praised model on Hugging Face, significantly lowering barriers in inference technology and production deployment, thus influencing the open-source strategy of major Chinese companies [9]. - Over the past year, Chinese AI models have seen increased downloads on Hugging Face, surpassing those from the U.S., indicating a shift in reliance on Chinese-developed open-source models within the global supply chain [9].