Workflow
AI推理
icon
Search documents
SRAM,取代HBM?
3 6 Ke· 2026-01-12 06:12
最近,英伟达战略性收购 AI 推理新秀 Groq 的事件,像一颗深水炸弹,在科技界引发了强烈震荡。这场交易不仅让 LPU(张量流处理器)背后的 SRAM 技术走向台前,更引发了一场关于"SRAM 是否会取代 HBM"的行业大辩论。 在近日召开的CES 2026会上,有采访人问黄仁勋相关的问题中,黄仁勋表示:"如果一切都能装进 SRAM,那确实不需要HBM,然而。。。" SRAM和HBM: 电子世界的"口袋"与"仓库" 要理解这句话的含金量,我们得先搞清楚:这两个缩写到底代表了什么? 在计算机世界里,数据存储遵循一个铁律:越快的东西越贵、越占地方;越大的东西越慢。 SRAM(静态随机存取存储器)是目前世界上最快的存储介质之一,直接集成在 CPU/GPU 核心旁边。它不需要像 DRAM 那样定时"刷新"电量,只要有 电,数据就稳如泰山。形象的来比喻,它就像是你的"衬衫口袋"。伸手即得,速度极快(纳秒级),但空间极小,只能放几张名片(几百MB)。 HBM(高带宽存储器)本质上仍是DRAM(动态随机存取存储器),我们电脑/服务器里最常见的内存条,容量大、便宜。只是用3D堆叠 + 超宽接口"贴 着"GPU/加速器封装在 ...
巨额「收编」Groq,英伟达意欲何为?
雷峰网· 2026-01-12 03:34
" 黄仁勋200亿美元买的是Jonathan Ross这个人。 " 作者丨胡清文 编辑丨徐晓飞 这究竟是招安潜在对手的缓兵之计,还是垄断推理市场的霸权布局? 01 重金收编的核心是什么? 2026年CES大会期间,英伟达管理层在面向投资者的会议上强调,此次收购Groq不会对核心业务产生冲 击,反而将为公司开辟全新的增长空间。 而这桩被包装成"非独家技术授权"的交易,本质是硅谷近年流行的 "收购式招聘" 的升级版:用授权的名 义实现"人才+技术"的双收。 瑞银分析师团队在研报中直言: "这是一场没有收购之名的完全收购,英伟达用最小的监管风险,获得了 最核心的战略资产。" " 黄仁勋这200亿美元,买的其实就是Jonathan Ross这个人 , 押注在此英伟达未来可能会赚回三倍的 钱,所以200 亿美元实在不算贵。 "某投资人近日向雷峰网透露。 2025年12月24日,英伟达以其史上最大规模交易额200亿美金,将推理芯片独角兽Groq的核心技术与团 队收入麾下。 Groq创始人、谷歌TPU初代核心开发者Jonathan Ross带队加盟英伟达,其独创的LPU芯 片技术将融入英伟达AI Factory架构 。 当 ...
SRAM,取代HBM?
半导体行业观察· 2026-01-12 01:31
公众号记得加星标⭐️,第一时间看推送不会错过。 最近,英伟达战略性收购 AI 推理新秀 Groq 的事件,像一颗深水炸弹,在科技界引发了强 烈震荡。这场交易不仅让 LPU(张量流处理器)背后的 SRAM 技术走向台前,更引发了一 场关于"SRAM 是否会取代 HBM"的行业大辩论。 在近日召开的CES 2026会上,有采访人问黄仁勋相关的问题中,黄仁勋表示:"如果一切都 能装进 SRAM,那确实不需要HBM,然而。。。" SRAM和HBM: 电子世界的"口袋"与"仓库" 要理解这句话的含金量,我们得先搞清楚:这两个缩写到底代表了什么? 在计算机世界里,数据存储遵循一个铁律:越快的东西越贵、越占地方;越大的东西越慢。 SRAM(静态随机存取存储器)是目前世界上最快的存储介质之一,直接集成在 CPU/GPU 核心旁 边。它不需要像 DRAM 那样定时"刷新"电量,只要有电,数据就稳如泰山。形象的来比喻,它就像 是你的"衬衫口袋"。伸手即得,速度极快(纳秒级),但空间极小,只能放几张名片(几百MB)。 HBM(高带宽存储器)本质上仍是DRAM(动态随机存取存储器),我们电脑/服务器里最常见的内 存条,容量大、便宜。 ...
从预训练到推理拐点,英伟达能靠Rubin延续霸权吗?
雷峰网· 2026-01-09 08:52
" 「六芯组合」是单芯片红利触顶的现实倒逼,也是英伟达在推理 市场的破局之举。 " 作者丨赵之齐 编辑丨包永刚 在预训练赛道凭借硬件性能与生态优势称霸的英伟达,进入AI推理时代后,面临新的挑战。 在CES 2026上,英伟达创始人兼CEO黄仁勋强调了"物理AI"是AI的下一波浪潮。他将推理性AI置于核心 位置,发布了具备自主思考能力的自动驾驶AI Alpamayo,提出了与西门子联手打造工业AI的未来蓝图, 并且, 也披露了下一代AI计算平台Vera Rubin的细节。 显然,黄仁勋不愿让Rubin停留在"概念革命"的想象层。他花了大量篇幅阐述AI推理带来的挑战:模型规 模每年增长十倍,推理从单次生成走向多步思考,所需算力呈指数级膨胀,更长的上下文也导致存储与带 宽压力飙升。 对此,英伟达给出的解决方案是,集成Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-X以太网交换机的组合平台。 在部分业内人士眼中, 这是一场"营销意味更重"的发布: 面对TPU、超节点等在推理领域相继崛起,以 及单芯片制程逼近物理极限 ...
闪迪一夜暴涨28%!老黄一句话,存储行情又燃了
华尔街见闻· 2026-01-07 12:43
周二美股市场存储概念股集体飙升,闪迪暴涨27.56%,创下自2月以来的最佳单日表现。西部数据和希捷科技紧随其后,分别大涨16.77%和14.00%。 这一轮行情的直接催化剂来自英伟达CEO黄仁勋在CES上的讲话。他直言: "就存储而言,这目前是一个完全未被开发的市场。这是一个从未存在过的市场, 而且很可能成为全球最大的存储市场,基本上承载全球AI的工作记忆(working memory)。" 与此同时,英伟达在CES上展示了针对代理AI推理优化的新存 储平台,承诺比传统平台提高五倍的能效。 这一轮暴涨并非偶然,而是市场对AI发展阶段认知的深刻修正。美银美林分析师Wamsi Mohan在最新的报告中指出,2026年将是企业级和边缘AI的拐点。随 着多模态AI(包含文本、图像、视频)的普及,数据生成量将呈指数级增长,这将推动硬件支出周期的延续。 随着AI浪潮从训练阶段向推理应用大规模迁移,被视为"AI工作记忆"的存储板块正迎来前所未有的价值重估。 美银认为,AI投资的主题正在从资本支出驱动的模型训练,转向以投资回报率(ROI)为核心的AI推理阶段, 这一转变将使存储、边缘设备和网络连接厂商成 为继GPU之后的新一 ...
谷歌看了都沉默:自家“黑科技”火了,但为啥研发团队一无所知?
3 6 Ke· 2026-01-07 11:04
如果说之前的AI模型是在模拟人类的思考,那么Gemini 3 Flash就是在模拟人类的「直觉」。 3倍于Gemini 2.5 Pro的速度,却拥有超越Pro级的推理能力。 当整个科技圈都在为「谷歌黑魔法」集体高潮时,真相恐给了所有人一记耳光。那套被捧上神坛的「并行验证循环」,不过是社交网络上AI生成的「赛 博跳大神」。 更离谱的是,它的智力竟然在某些基准测试超越了自家的Pro大哥。 | Benchmark | Description | | Gemini | Gemini | Gemini | Gemini | Claude | GPT-5.2 | Grok | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | | | | 3 Flash | 3 Pro | 2.5 Flash | 2.5 Pro | Sonnet | Extra high | 4.1 Fast | | | | | Thinking | Thinking | Thinking | Thinking | 4.5 | | Reasoning | | | | | | | ...
涨疯了!一盒内存条换上海一套房!带千亿龙头创历史新高,到底发生了什么?
雪球· 2026-01-07 09:09
Core Viewpoint - The A-share market experienced a slight increase, with the Shanghai Composite Index rising by 0.05%, marking a 14-day consecutive gain, while the Shenzhen Component Index and the ChiNext Index rose by 0.06% and 0.31%, respectively [1]. Group 1: Semiconductor Sector - The storage chip sector saw a significant surge, with leading company Zhaoyi Innovation's stock price reaching a new high, increasing nearly 9% during trading. Other companies like Hengkun New Materials and Anji Technology also experienced substantial gains [5][7]. - The price of storage chips has been rising sharply, with some products increasing over 100% since July 2025. For instance, a 256G DDR5 server memory module from Hynix and Samsung is priced over 40,000 yuan, with some reaching as high as 49,999 yuan per unit [7]. - Nomura Securities predicts that the current storage supercycle will last at least until 2027, with significant new supply not expected until early 2028. They recommend investors to focus on leading storage companies in 2026 [7]. Group 2: Photoresist and Rare Earths - The photoresist and rare earth sectors showed strong performance, with several stocks in the rare earth sector, such as China Rare Earth and Galaxy Magnetics, rising over 5% [9]. - The photoresist sector is critical for chip manufacturing, with a high dependency on imports for key materials. Recent developments indicate that domestic photoresist products are entering the verification stage, which could positively impact the industry [13]. Group 3: Semiconductor Equipment - The semiconductor equipment sector led the market gains, with companies like Zhongwei Company and Northern Huachuang reaching historical highs [15]. - Recent mergers and acquisitions in the semiconductor industry, including those by SMIC and Huahong, aim to strengthen core competitiveness and fill critical gaps in the supply chain [17]. - Dongwu Securities highlights that the domestic semiconductor equipment sector is entering a historic growth phase, with industry order growth expected to exceed 30% and potentially reach over 50% by 2026 [17].
联想发布,一系列AI大动作!
北京时间1月7日,2026年国际消费电子展(CES)期间,联想集团董事长兼CEO杨元庆在联想集团全球创 新科技大会(Tech World)上,介绍联想集团"混合式AI"的构想,并在与多位科技界企业家的对话中宣布 公司间的合作。 个人AI超级智能体发布 "无论是个人还是企业,对人工智能的需求都是不同的,单一的AI模型或AI设备无法满足用户所有需 求。"杨元庆表示,整合了个人智能、企业智能与公共智能的混合式AI,才是打造个性化多样性的AI、 推动AI普及普惠的终极路径。 联想发布三大核心技术:智能模型编排(Intelligent Model Orchestration)、智能体内核(Agent Core)与多智 能体协作(Multi-agent Collaboration)。三者共同构建起混合式AI的技术底座。 其中智能模型编排技术可实时根据用户需求匹配最佳模型;智能体内核可深度理解用户意图、分解复杂 任务并持续学习,让普通AI智能体成为用户个人的AI超级智能体;多智能体协作技术可以让AI智能体 进行团队协作,拓展了AI处理复杂任务的能力。 会上,联想发布个人AI超级智能体Lenovo Qira,作为联想天禧超级 ...
杨元庆:新一轮算力浪潮将源于AI推理的爆发|直击CES
Xin Lang Cai Jing· 2026-01-07 02:35
事实上,全球AI行业对于未来全球算力基础设施的竞争焦点正在从"训练"转移至"推理"这一趋势已形成 广泛共识。 为应对当前AI推理面临的内存、延迟、安全及能耗等挑战,联想集团最新发布了业界最全面的推理优 化服务器产品组合,包括AI推理服务器SR675i、SR650i和边缘计算服务器SE455i,旨在将AI模型带到 本地和边缘等离数据源头更近的地方,大幅提升推理效率,降低运营成本,并强化数据安全性,以适应 企业多样化、实时化的AI部署需求。 新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目 的,并不意味着赞同其观点或证实其描述。 责任编辑:王翔 专题:联想创新科技大会 新浪科技讯 北京时间2026年1月7日,联想集团董事长兼CEO杨元庆在全球创新科技大会(CES)主旨 演讲环节上表示, 新一轮的算力浪潮将源于AI推理的爆发。 杨元庆认为,全球算力基础设施市场经历了四波创新浪潮的洗礼:第一波是依托传统计算的企业信息化 与数字化转型;第二波由云服务、云应用驱动,推动云计算快速兴起;第三波则是大语言模型训练催生 的大规模算力集群,这一阶段的AI训练主要集中在云端。"如今,我们正 ...
存储再度爆发!AI推理与多模态驱动数据爆炸,硬盘和闪存厂商将成最大受益者
Hua Er Jie Jian Wen· 2026-01-07 01:51
这一轮暴涨并非偶然,而是市场对AI发展阶段认知的深刻修正。美银美林分析师Wamsi Mohan在最新的报告中指出,2026年将是企业级和边缘AI 的拐点。随着多模态AI(包含文本、图像、视频)的普及,数据生成量将呈指数级增长,这将推动硬件支出周期的延续。 美银认为,AI投资的主题正在从资本支出驱动的模型训练,转向以投资回报率(ROI)为核心的AI推理阶段,这一转变将使存储、边缘设备和网 络连接厂商成为继GPU之后的新一轮受益者。 AI推理与多模态:数据爆炸的真正推手 随着AI浪潮从训练阶段向推理应用大规模迁移,被视为"AI工作记忆"的存储板块正迎来前所未有的价值重估。 周二美股市场存储概念股集体飙升,闪迪暴涨27.56%,创下自2月以来的最佳单日表现。西部数据和希捷科技紧随其后,分别大涨16.77%和 14.00%。 这一轮行情的直接催化剂来自英伟达CEO黄仁勋在CES上的讲话。他直言:"就存储而言,这目前是一个完全未被开发的市场。这是一个从未存在 过的市场,而且很可能成为全球最大的存储市场,基本上承载全球AI的工作记忆(working memory)。"与此同时,英伟达在CES上展示了针对 代理AI推理优化 ...