AI推理
Search documents
AMD财报解读:下跌就是机会
美股研究社· 2026-02-06 10:55
作者 Michael Del Monte ,内容为转载编译,仅为呈现不同市场观点与研究视角,并不意味 着本公众号对文中观点结论认可。 超威半导体(AMD)2025 财年收官业绩表现强劲,营收实现乐观增长,同时利润率大幅改善 。公司规划雄心勃勃,计划在 2026 年下半年推出 MI400 系列 GPU,2027 财年发布 MI500 系列 GPU。随着 AI 开发者与企业开始扩充 AI 推理专用算力,AMD 有望迈入全新增 长轨道。凭借 2026 财年稳健的业绩展望,叠加 2025 年第四季度财报发布后的股价大幅回 调,分析师将 AMD 评级上调至 强力买入。 【如需和我们交流可扫码添加进社群】 A M D 业 务 运 营 情 况 2025 年第四季度,AMD 凭借 MI350 系列 GPU 与 霄龙(EPYC)CPU 实现亮眼销售业 绩,净营收同比大增 37.58% 。2025 财年霄龙实例部署量增长尤为突出,云服务提供商 (CSP)部署量增幅超 50%,企业端部署量翻番以上。 2025 年 Q4 的核心看点在于 AMD 下一代 Instinct 系列 AI 加速专用 GPU 矩阵: · MI455X 与 H ...
招商证券:预计2026全年存储供给偏紧状态持续 产业链公司整体展望乐观
智通财经网· 2026-02-06 07:18
智通财经APP获悉,招商证券发布研报称,2026年一季度以来,各类存储产品价格环比急剧上涨,目前 在能见度范围内今年存储价格持续上涨可期,同时2026年全球新增供给有限,预计存储紧缺趋势将延续 至2027年。在价格与需求共振情况下,今年海内外存储将迎来业绩释放大年,后续市场价格趋势和各环 节公司业绩增长持续性是核心关注点,建议关注存储+设备+产业链三大核心环节相关公司。 招商证券主要观点如下: 库存端:产业链库存呈现显著的分化特征,原厂库存紧张将贯穿2026全年 原厂库存水位持续回落,服务器DRAM与NAND紧缺趋势预计将贯穿2026全年,奠定长期卖方市场基 础;中下游台厂与中国内地厂商普遍积极备货,其中中国内地模组厂Q3库存累计同比高增34%创历史 新高,以应对2026年供需缺口,后续有望在价格上行周期中通过低成本库存重估,释放巨大的利润弹 性。 价格端:AI产能挤占效应导致供需缺口持续扩大,26Q1合约价环比高增 现货价格方面,虽然DDR4价格首次出现小幅回调,但原厂供应停滞支撑整体价格维持高位,并不影响 整体价格走势;合约价格方面,在服务器强劲需求拉动下呈现急剧上涨态势,预计26Q1DRAM与 NAND ...
优刻得全浸没液冷机柜上架乌兰察布,GPU算力密度提升50%
2 1 Shi Ji Jing Ji Bao Dao· 2026-02-06 02:55
Core Insights - The company UCloud has officially launched its liquid-cooled cabinets at the Ulanqab Intelligent Computing Center, marking the beginning of large-scale commercial use [1] Product Features - The new liquid-cooled cabinet features a compact design, reducing the height from the traditional 6U to 4U, while supporting 8 high-performance GPU cards, resulting in a 50% increase in computing density [1] - The immersion liquid cooling technology lowers the operating temperature of GPUs by 15°C and reduces overall power consumption by 15%, with operational noise levels below 35dB, making it suitable for high-load scenarios such as AI training, AI inference, and supercomputing [1]
1596亿,AI芯片超级独角兽诞生
3 6 Ke· 2026-02-05 05:15
芯东西2月5日报道,今日,美国AI芯片独角兽Cerebras Systems宣布完成10亿美元(约合人民币69亿元)F轮融资,估值达到230亿美元(约合 人民币1596亿元)。 本轮融资由Tiger Global领投,Benchmark、Fidelity Management & Research Company、Atreides Management、Alpha Wave Global、Altimeter、 AMD、Coatue以及1789 Capital(合伙人包括小唐纳德·特朗普)等机构跟投。 成立于2015年的Cerebras,以餐盘大小的AI芯片而闻名。其晶圆级引擎3(WSE-3)芯片是全球最大、速度最快的AI芯片,体积是当前最大 GPU的56倍,单位计算功耗却远低于同类产品,同时推理和训练速度比竞品快20倍以上。 其芯片用于处理AI推理所需的顺序执行、内存密集型工作负载。与需要在芯片和内存之间来回传输数据的GPU不同,WSE将所有运算都保存 在芯片内部,从而消除了限制GPU推理能力的内存带宽瓶颈。 Cerebras上一轮融资是在2025年9月宣布完成的11亿美元(约合人民币76亿元)G轮融资,当时 ...
中国推理芯片突围与成本革命:破“内存墙”、兼容CUDA
2 1 Shi Ji Jing Ji Bao Dao· 2026-02-04 09:09
Core Insights - The article discusses the shift in the global AI computing power focus from training to inference, indicating a competitive landscape for cost-effective and energy-efficient chips [1][2] - The consensus in the industry is that inference chips will dominate AI evolution in the next five to ten years, with companies like Google and Nvidia leading the charge [1][3] - CloudWalk Technology has announced its strategic focus on AI inference chips, aiming to significantly reduce the cost of processing tokens, which are becoming a core productivity driver in the AI landscape [2][3] Industry Trends - The demand has shifted from relying on high-performance GPUs to a pressing need for high-cost performance inference chips [2] - The past year has seen a dramatic increase in the computational requirements for large models, with token processing needs growing hundreds of times, highlighting the importance of inference over training [2][3] - Nvidia's strategic acquisition of Groq's core assets for $20 billion reflects the growing importance of inference chips, with Groq's valuation skyrocketing from $7 billion to $20 billion in just four months [3] Company Strategy - CloudWalk Technology's CEO, Chen Ning, emphasizes the goal of reducing the cost of processing one million tokens by 100 times, aiming for a transformative impact on industrial productivity by 2030 [3][4] - The company is developing a new processor architecture, GPNPU, designed to optimize inference for large models while addressing cost, efficiency, and deployment challenges [5][6] - The GPNPU architecture aims to maintain compatibility with existing CUDA programs, lowering the barrier for integration into production systems [5][6] Product Development - CloudWalk Technology plans to launch the DeepVerse 100, 200, and 300 series chips over the next five years, targeting major clients across various industries [6] - The company is focusing on modular chip design through a "power building block" approach, allowing for scalable and flexible computing solutions [6] - The company has established a strong domestic production capacity, ensuring supply chain security for large-scale chip production and delivery [6]
英伟达GPU,被嫌弃了
Xin Lang Cai Jing· 2026-02-04 02:27
据八位知情人士透露,OpenAI 对英伟达最新的一些人工智能芯片并不满意,并且从去年以来一直在寻 求替代方案,这可能会使人工智能热潮中两家最受瞩目的公司之间的关系变得复杂。 ChatGPT 的开发商英伟达的战略转变在于更加重视用于执行特定 AI 推理环节的芯片。AI 推理是指 AI 模型(例如 ChatGPT 应用所使用的模型)响应用户查询和请求的过程。英伟达在用于训练大型 AI 模型 的芯片领域仍然占据主导地位,而推理环节则成为竞争的新战场。 OpenAI 和其他公司决定在推理芯片市场寻求替代方案,这标志着英伟达在人工智能领域的统治地位受 到了重大考验,而此时两家公司正在进行投资谈判。 9 月,英伟达表示,计划向 OpenAI 投资高达 1000 亿美元,作为一项交易的一部分,该交易使这家芯片 制造商获得了这家初创公司的股份,并为 OpenAI 提供了购买先进芯片所需的资金。 路透社报道称,这笔交易原本预计几周内就能完成。然而,谈判却拖延了数月之久。在此期间, OpenAI 还与 AMD 以及其他旨在与英伟达竞争的GPU达成了合作协议。但一位知情人士表示,该公司 不断变化的产品路线图也改变了其所需的计算资源 ...
OpenAI被曝“嫌弃”英伟达(NVDA.US)AI芯片 奥尔特曼亲自回应:疯狂说法毫无依据
智通财经网· 2026-02-03 12:24
智通财经APP获悉,据知情人士透露,OpenAI对英伟达(NVDA.US)旗下多款最新AI芯片的表现感到不 满,且自去年起便开始寻求替代方案。 报道指出,OpenAI的这一战略调整,核心原因是公司对AI推理环节专用芯片的重视程度持续提升。目 前英伟达在大模型训练芯片领域仍占据绝对主导地位,但AI推理芯片已成为行业竞争的全新主战场。 AI推理,指的是经训练后的AI模型,运用习得的知识分析全新的未标注数据,进而完成预测、决策或 生成输出结果的过程。 针对相关报道,OpenAI首席执行官奥尔特曼在X平台发文回应称:"我们十分乐意与英伟达合作,他们 打造了全球最顶尖的AI芯片。我们希望在未来很长一段时间里,都能成为英伟达的核心大客户。我实 在无法理解这些疯狂的说法是从哪里来的。" 英伟达发言人也在一份邮件声明中表示:"客户始终选择英伟达的推理芯片,因为我们能在规模化部署 中,提供最佳的性能表现和总拥有成本优势。" 报道强调,OpenAI等企业在推理芯片市场寻找替代方案的举动,是对英伟达AI芯片霸主地位的一次考 验,而这一情况发生时,双方正处于投资合作的洽谈阶段。 2025年9月,英伟达曾宣布计划向微软(MSFT.US ...
OpenAI不满英伟达芯片?两高管隔空反驳
3 6 Ke· 2026-02-03 07:40
最近有消息称OpenAI对英伟达的某些最新人工智能芯片表示不满,并且自去年以来就一直在寻求替代 方案,这可能会使这两家在人工智能热潮中最为知名的公司之间的关系变得有些复杂。 尽管英伟达CEO黄仁勋和OpenAI CEO阿尔特曼都隔空反驳了这一传言,不过这一传言凸显出,虽然英 伟达在用于训练大型人工智能模型的芯片方面仍占据主导地位,但AI推理可能已成为芯片竞争的新战 场。 英伟达芯片的推理短板? 最近有消息称,由于OpenAI的策略转变,使得其越来越重视用于执行人工智能推理部分的芯片。AI 推 理是指 AI 模型(例如 ChatGPT 应用所使用的模型)响应用户查询和请求的过程。 毋庸置疑的是,英伟达的GPU非常适合用于处理大规模数据运算,这是训练像 ChatGPT 这样大型人工 智能模型所必需的。但如今,人工智能的进步越来越侧重于将训练好的模型用于推理和判断,这可能是 一个全新的、更大的的人工智能阶段。 推理所需的内存比训练更多,因为芯片需要花费相对更多的时间从内存中获取数据,而不是执行数学运 算。 然而,英伟达和AMD的GPU技术依赖于外部内存,这会增加处理时间,并减慢用户与聊天机器人互动 的速度。 相比之 ...
英伟达GPU,被嫌弃了
半导体行业观察· 2026-02-03 01:35
Core Viewpoint - OpenAI is dissatisfied with some of NVIDIA's latest AI chips and has been seeking alternatives since last year, indicating a potential shift in the relationship between these two prominent companies in the AI sector [2][3]. Group 1: OpenAI's Concerns - OpenAI's dissatisfaction stems from the performance of NVIDIA's hardware in providing timely responses for specific queries, particularly in software development and AI communication, which has led to a need for new hardware to meet approximately 10% of its future inference computing demands [3][8]. - OpenAI has explored partnerships with startups like Cerebras and Groq to obtain faster inference chips, but negotiations with Groq fell through due to NVIDIA's $20 billion licensing agreement with Groq [4][5]. Group 2: NVIDIA's Position - NVIDIA's CEO Jensen Huang has denied reports of a strained relationship with OpenAI, asserting that the company plans to invest up to $100 billion in OpenAI and that customers continue to choose NVIDIA for inference due to its performance and cost-effectiveness [3][5]. - NVIDIA has engaged with companies like Cerebras and Groq to explore potential acquisitions of SRAM chip technology, which is crucial for enhancing inference capabilities [10]. Group 3: Market Dynamics - The AI industry is witnessing a shift towards inference-focused chips, with OpenAI's efforts reflecting a broader trend where companies are prioritizing speed and efficiency in processing user requests [7][8]. - Competitors like Anthropic and Google benefit from using proprietary chips designed specifically for inference, which may provide them with performance advantages over NVIDIA's general-purpose AI chips [8].
股价突跌2.89%!路透:OpenAI对英伟达最新一些AI芯片不满意,寻求替代方案!英伟达AI主导地位迎重大考验!
美股IPO· 2026-02-02 23:15
OpenAI对英伟达最新的一些人工智能芯片并不满意,并且自去年以来一直在寻找替代方案,这可能会使这两家AI热潮中最受关注的公司之间的关系变得 更加复杂。 据媒体援引多位知情人士表示,OpenAI对英伟达最新的一些人工智能芯片并不满意,并且自去年以来一直在寻找替代方案,这可能会使这两家 AI热潮中最受关注的公司之间的关系变得更加复杂。 OpenAI这一战略转变,源于其对用于执行AI推理中特定环节芯片的重视程度不断提高。所谓推理,是指像支撑ChatGPT应用的AI模型在响应用 户问题和请求时所进行的计算过程。英伟达在训练大型AI模型所需的芯片领域仍占据主导地位,而推理正成为竞争的新战场。 分析称,OpenAI及其他公司决定在推理芯片市场寻找替代方案,标志着对英伟达AI主导地位的一次重大考验。 周一,英伟达收跌近2.9%。 当前,OpenAI和英伟达这两家公司仍在进行投资谈判: 去年9月,英伟达表示,计划向OpenAI投入高达1000亿美元,作为一项交易的一部分。该交易将使英伟达获得这家初创公司的股份,同时为OpenAI提 供购买先进芯片所需的资金。 在此期间,OpenAI已与AMD等公司达成协议,采购可与英伟达竞 ...