Workflow
AI推理
icon
Search documents
从拼模型到算成本,曦望用S3 GPU给出最佳答案
半导体芯闻· 2026-01-29 10:10
更大的模型、更高端的GPU、更密集的算力投入,构成了这一阶段最鲜明的特征。训练能力一度 等同于技术先进性,也决定了厂商在产业链中的话语权。但随着大模型规模趋于稳定、训练节奏 放缓,AI系统的主要负载正在发生转移。真正被频繁调用、持续消耗算力的,不再是一次性的模 型训练,而是无处不在、实时发生的推理请求。 在 AI 产 业 从 训 练 走 向 推 理 的 关 键 转 折 点 , 曦 望 科 技 于 2026 年 1 月 27 日 举 办 首 届 Sunrise GPU Summit产品发布会,正式发布新一代推理GPU芯片启望S3,并同步推出寰望SC3超节点解决方 案及推理云计划。这是曦望在完成近30亿元战略融资后的首次系统性技术亮相。 如果您希望可以时常见面,欢迎标星收藏哦~ 过去两年,AI产业的重心高度集中在训练。 在发布会上,中国工程院院士、浙江大学信息学部主任吴汉明出席发表致辞并指出,当前国内正 处于集成电路与人工智能深度融合的关键时期,算力作为核心生产力,关系到科技自立自强战略 的落实。 "AI规模化应用对算力提出了前所未有的要求,传统芯片已难以满足多场景下的高效能需求。"吴 汉明强调,推理算力价值的实 ...
未知机构:东吴计算机无惧回调持续推荐GPUNative数据库-20260129
未知机构· 2026-01-29 02:10
今日星环科技有所回调,我们认为主要是资金交易因素,基本面没有变化。 【东吴计算机】无惧回调,持续推荐 GPU-Native数据库 今日星环科技有所回调,我们认为主要是资金交易因素,基本面没有变化。 海力士业绩大超预期,美股存储盘前大涨。 近期moltbot等应用火爆,云服务涨价。 AI推理时代大势所趋,NV新存储架构已经推出,GPU-Native数据库需求旺盛。 海力士业绩大超预期,美股存储盘前大涨。 近期moltbot等应用火爆,云服务涨价。 AI推理时代大势所趋,NV新存储架构已经推出,GPU-Native数据库需求旺盛。 星环科技正与NV紧密 【东吴计算机】无惧回调,持续推荐 GPU-Native数据库 星环科技正与NV紧密联合研发和调优GPU-Native数据库,进展顺利。 ...
微软这颗芯片,撼动英伟达?
半导体行业观察· 2026-01-29 01:15
Core Insights - Microsoft is the largest user of OpenAI models and has completed the development of its Maia AI accelerator, which aims to enhance AI capabilities [2] - Major cloud service providers and GenAI model developers are creating custom AI XPUs to reduce the cost of GenAI inference workloads [2] - Nvidia currently dominates the AI training market, while AI inference computing power is expected to be an order of magnitude higher than training, presenting opportunities for over a hundred AI computing startups [2] Group 1: Microsoft and AI Hardware Development - Microsoft aims to control its hardware resources while deploying AI-driven systems, balancing the use of third-party GPUs and CPUs with its own developed computing engines [3] - The Maia 100 XPU, announced in November 2023, is designed to support AI training and inference, specifically for OpenAI's GPT models, although its performance has been questioned [4][12] - The upcoming Maia 200 XPU, set for release in January 2026, is designed specifically for AI inference, simplifying its architecture [5] Group 2: Technical Specifications of Maia Chips - The Maia 100 chip features 64 cores, approximately 500MB of total L1 and L2 cache, and a total of 105 billion transistors, with a clock speed of around 2.86GHz [12][14] - The Maia 200 chip will utilize TSMC's N3P process, increasing transistor count to 144 billion and improving clock speed to 3.1GHz, while also enhancing memory capacity and bandwidth significantly [21][22] - The Maia 200 chip's tensor units are expected to deliver 10.15 petaflops at FP4 precision and 5.07 petaflops at FP8 precision, with a total power consumption of 750W [24] Group 3: Deployment and Future Plans - The Maia 200 computing engines will be used to support OpenAI's GPT-5.2 model and will drive Microsoft's Foundry AI platform and Office 365 Copilot [26] - Currently, there is no information on when Azure will offer VM instances based on the Maia 200, which would allow testing of various AI models [26]
曦望发布启望S3推理成本较上一代降约90%,押注「极致性价比」GPU与算力新范式
IPO早知道· 2026-01-29 00:15
2025年芯片交付量已突破万片。 本文为IPO早知道原创 作者| 苏打 微信公众号|ipozaozhidao 在大模型产业从"训练驱动"走向"推理驱动"的关键拐点上,国产GPU厂商正重新审视算力的商业价 值与交付方式。 据IPO早知道消息,1 月 27 日,曦望(Sunrise)于首届Sunrise GPU Summit中,正式发布新一 代推理GPU芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也 是曦望在近一年累计完成约30亿元战略融资后首次集中公开亮相。 曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI产业正从"训练驱动"转向"推理驱动"。 相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。 "谁能持续降低推理成本,谁就掌握了AI产业的成本曲线。"他指出, 曦望并不希望只做一家卖芯片 的公司,而是围绕推理场景,构建"芯片+系统+生态"的整体布局,让推理算力真正成为可规模化、 可持续的基础设施。 2025年,专注于推理GPU的曦望芯片交付量已突破万片。 徐冰表示,希望通过推理算力体系的系 统性创新,助力AI应用实现规模化落地与可持续增长。 S3继续强 ...
云天励飞陈宁:AI推理爆发带动全球产业进入“中国时刻”
陈宁 从早期的行业解决方案,到大模型时代的标准硬件及服务,再到当前发力的AI推理芯片,云天励飞在 AI领域跟随市场需求,构建了宽深的技术护城河。 ◎记者 李兴彩 智谱、MiniMax先后登陆港股,CES 2026上人山人海……进入2026年,国内AI行业的热度依然不减,但 行业的重点和增长点,正在悄然转向AI推理。 "不管是英伟达、AMD,还是国内的众多公司,都把目光集中在AI应用,包括智能驾驶、机器人、AI眼 镜、智能体……"谈及AI推理市场发展,云天励飞董事长陈宁近日在接受上证报记者专访时表示,2026 年国际消费电子展(CES 2026)上AI应用纷呈,再次显示出风向标意义,也正式拉开了AI推理大时代 的帷幕。 在陈宁看来,2026年是AI发展核心推动力由AI训练转向AI推理的转折之年,是未来五年AI应用大规模 落地的开端。伴随而来的万亿规模AI推理大市场,既是中国公司的大机遇,也将带动全球AI产业进 入"中国时刻"。 而从CNN小模型的视觉智能感知1.0时代,进入到理解自然语言的AI大模型时代,云天励飞一直瞄准、 等待的就是AI推理市场。 陈宁表示,不同于AI训练,AI推理用户需要极致的性价比,从这个 ...
美股异动 | 金山云(KC.US)盘前涨6% 星流平台完成战略升级
智通财经网· 2026-01-26 14:24
Core Viewpoint - Kingsoft Cloud (KC.US) has upgraded its AI training and inference platform, StarFlow, to a comprehensive solution, enhancing its capabilities in resource management, training task recovery, and commercializing model API services [1] Company Summary - Kingsoft Cloud's stock rose by 6% to $13.08 ahead of the market opening [1] - The company’s Senior Vice President, Liu Tao, announced the strategic upgrade of the StarFlow platform during the annual Tech Talk on January 21 [1] - The upgraded StarFlow platform now includes a full-cycle closed loop from heterogeneous resource scheduling to industry application support and model API commercialization [1] Industry Summary - A McKinsey report predicts that the global AI inference market will reach $150 billion by 2028, with a compound annual growth rate (CAGR) exceeding 40% from 2025 to 2028 [1] - The AI infrastructure, particularly intelligent computing, is expected to experience unprecedented market growth as it supports the surge in AI applications [1] - The enhancements made to the StarFlow platform position Kingsoft Cloud to effectively capitalize on the anticipated explosion of AI applications [1]
研报掘金丨国海证券:维持澜起科技“买入”评级,或受益于CPU与GPU比例的提升
Ge Long Hui A P P· 2026-01-26 08:32
Core Viewpoint - Guohai Securities report indicates that Lanke Technology is expected to achieve a year-on-year net profit growth of 52.29% to 66.46% by 2025, driven by increased shipments of interconnect chips [1] Group 1: Company Performance - Lanke Technology is positioned as a leading player in the Retimer chip market globally, focusing on deep integration of CXL technology [1] - The demand for memory interconnect chips is anticipated to rise due to the increasing ratio of CPU to GPU, benefiting Lanke Technology in the AI era [1] Group 2: Industry Trends - The ongoing iteration of memory interconnects is being driven by AI inference, which is expanding the demand for HBM and DRAM while simultaneously increasing the requirements for CPUs [1] - AMD projects that its AI server CPU market will grow from approximately $8.2 billion in 2025 to around $30 billion by 2030, indicating significant growth potential in the sector [1]
AI推理刚需,NAND“周期更长更稳”!摩根大通:本轮主角是eSSD,铠侠成为首选
Hua Er Jie Jian Wen· 2026-01-26 03:34
别再盯着GPU和HBM高带宽内存了,AI推理浪潮正在让NAND闪存摆脱"强周期商品"的宿命,演变成一种高增长的AI基础设施资产。 据追风交易台消息,1月23日,摩根大通亚太区科技研究团队发布深度研报《半导体:NAND——更长、更强的上升周期》,宣告NAND行业进入 了一个由AI推理驱动的全新超级周期。与过去依靠智能手机和PC出货量驱动的周期不同,本轮周期的核心驱动力是企业级SSD(eSSD)。 摩根大通认为,随着AI工作负载从训练向推理转移,以及HDD(机械硬盘)在近线存储领域的供应瓶颈,NAND市场正迎来前所未有的结构性增 长。而投资者严重低估了NAND在AI推理时代的战略地位。 告别"周期诅咒":10%的增长成过往,迎接30%的TAM爆发 长久以来,NAND行业一直被视为典型的强周期性大宗商品:技术进步带来成本下降,厂商疯狂扩产,随即引发价格崩盘。 但现在,这个逻辑被打破了。 摩根大通复盘了过去25年的数据发现,无论是过去20年、15年还是5年,NAND行业的TAM(潜在市场规模)年均复合增长率(CAGR)始终徘徊 在7%-12%的区间内。 然而,预测数据显示,在接下来的三年(2025-2027年),这一 ...
金山云大涨超9%,金山云星流平台完成战略升级
Jin Rong Jie· 2026-01-26 02:07
刘涛披露,公司智算云业务Q3账单收入达7.8亿元,同比增速近120%,主要受益于行业内具身智能场景 及AI推理场景爆发。其中,小米金山生态的贡献显著,2025年上半年相关收入占年度关联交易总额的 40%。除了小米金山生态这个基本盘,金山云的外部客户用量也在齐增。 1月26日,金山云早盘大涨超9%,最高触及7.05港元。消息面上,在上周举办的金山云年度Tech Talk 上,金山云高级副总裁刘涛宣布,智算平台金山云星流已完成从资源管理平台向一站式AI训推全流程 平台的战略升级。据悉,金山云星流训推平台提供从模型开发、训练到推理的完整生命周期管理,具备 开发、训练、推理和数据处理四大模块能力,通过降低多模块协同复杂度,能实现"开箱即用"的AI开发 体验。 ...
港股异动|金山云大涨超9%,金山云星流平台完成战略升级
Ge Long Hui· 2026-01-26 01:56
刘涛披露,公司智算云业务Q3账单收入达7.8亿元,同比增速近120%,主要受益于行业内具身智能场景 及AI推理场景爆发。其中,小米金山生态的贡献显著,2025年上半年相关收入占年度关联交易总额的 40%。除了小米金山生态这个基本盘,金山云的外部客户用量也在齐增。(格隆汇) 金山云(3896.HK)大涨超9%,最高触及7.05港元。消息面上,在上周举办的金山云年度Tech Talk上,金 山云高级副总裁刘涛宣布,智算平台金山云星流已完成从资源管理平台向一站式AI训推全流程平台的 战略升级。据悉,金山云星流训推平台提供从模型开发、训练到推理的完整生命周期管理,具备开发、 训练、推理和数据处理四大模块能力,通过降低多模块协同复杂度,能实现"开箱即用"的AI开发体验。 ...