Workflow
启望S3
icon
Search documents
国产AI芯片,疯狂秀肌肉
3 6 Ke· 2026-01-30 00:25
早前,央视《新闻联播》中就曾预告,阿里即将自研PPU芯片,不过,很长时间以来,这款芯片都很神秘。 1月29日上午,平头哥官网悄然上线一款名为"真武810E"的高端AI芯片,这是通义实验室、阿里云和平头哥组成的阿里巴巴AI黄金三角"通云哥"首次浮出 水面。 "真武"PPU采用全栈自研架构,配备96G HBM2e内存及700 GB/s片间互联带宽,适用于AI训练、推理及自动驾驶。目前,该芯片已大规模用于千问大模型 的训练与推理,并通过阿里云AI软件栈深度优化,为客户提供一体化服务。 你我都知道,在AI的趋势下,所有芯片都在疯狂涨价。在AI狂野发展的过程中,无疑有着巨大的算力缺口,英伟达也成了当下最赚钱的公司。不过,随 着地缘政治摩擦日益加重,很多人关注AI芯片的发展。 数据显示,我国AI芯片,将在2028年进入万亿市场规模时代,约占全球市场的30%。可以说,面对旺盛的市场需求,提供自主可控的高质量AI算力,已成 为我国抢占AI发展先机、赋能千行百业转型升级的重要基础。 近期,多家国产厂商接连宣布AI芯片的消息,我国AI芯片正在以惊人的速度高速发展。 阿里:自研芯片亮相 "真武"PPU已在阿里云实现多个万卡集群部署 ...
曦望董事长徐冰:把大模型推理这件事,做到极致
Sou Hu Cai Jing· 2026-01-29 11:35
Core Insights - The core message emphasizes that whoever masters efficient, controllable, and sustainable inference infrastructure will dominate the speed of AI implementation [3][5]. Group 1: Company Overview - The company, known as Xi Wang, is positioned as a leading GPU chip company focused on inference, aiming to optimize large model inference [4]. - Xi Wang's mission is to excel in large model inference, transitioning from a training-driven to an inference-driven AI industry [4][5]. - The company was established in 2020, evolving from the chip division of SenseTime, and has accumulated significant experience in AI applications over the past decade [5][6]. Group 2: Market Trends - By 2026, inference computing power is projected to account for 66% of AI workloads, surpassing training, indicating a structural shift in the industry [4]. - The demand for real-time interaction and complex scenarios, such as 3D and video generation, is driving the need for high-frequency response in AI applications [4][5]. Group 3: Cost Structure and Strategy - Inference costs currently represent 70% of AI application expenses, which is critical for profitability and commercial success [4][5]. - The company aims to reduce inference costs significantly, targeting a reduction from "per unit" to "per fraction," making AI infrastructure as accessible as utilities [4][7]. Group 4: Product Development and Innovation - Xi Wang has invested 2 billion in R&D over the past eight years, successfully producing the S1 and S2 chips, with the S3 chip recently launched [7][8]. - The company plans to set a new industry benchmark by achieving a cost of "one cent per million tokens" for inference [7][8]. Group 5: Business Model - The company is not merely a chip seller but aims to create a comprehensive ecosystem around "chip + system + ecology" [8][9]. - Xi Wang intends to collaborate with major AI firms and various computing power providers to optimize existing systems and enhance cost efficiency [8][9]. Group 6: Future Vision - The company envisions becoming the foundational infrastructure for affordable and stable computing power in the AI era, linking technology, policy, and commercial models [9]. - The future of AI in China is expected to rely on scalable and cost-effective inference infrastructure, marking a significant transition from following to leading in the domestic AI chip market [9].
从拼模型到算成本,曦望用S3 GPU给出最佳答案
半导体芯闻· 2026-01-29 10:10
更大的模型、更高端的GPU、更密集的算力投入,构成了这一阶段最鲜明的特征。训练能力一度 等同于技术先进性,也决定了厂商在产业链中的话语权。但随着大模型规模趋于稳定、训练节奏 放缓,AI系统的主要负载正在发生转移。真正被频繁调用、持续消耗算力的,不再是一次性的模 型训练,而是无处不在、实时发生的推理请求。 在 AI 产 业 从 训 练 走 向 推 理 的 关 键 转 折 点 , 曦 望 科 技 于 2026 年 1 月 27 日 举 办 首 届 Sunrise GPU Summit产品发布会,正式发布新一代推理GPU芯片启望S3,并同步推出寰望SC3超节点解决方 案及推理云计划。这是曦望在完成近30亿元战略融资后的首次系统性技术亮相。 如果您希望可以时常见面,欢迎标星收藏哦~ 过去两年,AI产业的重心高度集中在训练。 在发布会上,中国工程院院士、浙江大学信息学部主任吴汉明出席发表致辞并指出,当前国内正 处于集成电路与人工智能深度融合的关键时期,算力作为核心生产力,关系到科技自立自强战略 的落实。 "AI规模化应用对算力提出了前所未有的要求,传统芯片已难以满足多场景下的高效能需求。"吴 汉明强调,推理算力价值的实 ...
曦望发布启望S3推理成本较上一代降约90%,押注「极致性价比」GPU与算力新范式
IPO早知道· 2026-01-29 00:15
2025年芯片交付量已突破万片。 本文为IPO早知道原创 作者| 苏打 微信公众号|ipozaozhidao 在大模型产业从"训练驱动"走向"推理驱动"的关键拐点上,国产GPU厂商正重新审视算力的商业价 值与交付方式。 据IPO早知道消息,1 月 27 日,曦望(Sunrise)于首届Sunrise GPU Summit中,正式发布新一 代推理GPU芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也 是曦望在近一年累计完成约30亿元战略融资后首次集中公开亮相。 曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI产业正从"训练驱动"转向"推理驱动"。 相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。 "谁能持续降低推理成本,谁就掌握了AI产业的成本曲线。"他指出, 曦望并不希望只做一家卖芯片 的公司,而是围绕推理场景,构建"芯片+系统+生态"的整体布局,让推理算力真正成为可规模化、 可持续的基础设施。 2025年,专注于推理GPU的曦望芯片交付量已突破万片。 徐冰表示,希望通过推理算力体系的系 统性创新,助力AI应用实现规模化落地与可持续增长。 S3继续强 ...
曦望发布推理GPU芯片启望S3 推进推理云生态共建
Zheng Quan Ri Bao Wang· 2026-01-28 12:53
本报讯 (记者袁传玺)1月27日,专注于推理GPU的曦望(Sunrise)在杭州举办首届Sunrise GPU Summit,发布新一代推理GPU芯片"启望S3",并披露其围绕推理场景构建的算力产品体系及共建推理 云生态计划。这也是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。 王勇表示,曦望的推理GPU并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化 设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件 体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖ModelScope平台90%以上主流大模型形 态。 围绕启望S3,曦望同步发布了面向大模型推理的寰望SC3-256超节点方案,可高效支撑PD分离架构与大 规模专家并行(EP)部署,适配千亿、万亿级参数的多模态MoE推理场景。 同时,曦望还推出覆盖PCIe、OAM模组、一体机及AI计算集群在内的S3产品矩阵,覆盖从单机推理到 大规模集群部署的多样化需求。 值得关注的是,曦望通过生态共建推理云被视为其推理算力体系中的关键一环。依托自研推理GPU,曦 望实现从底层芯片到上层平台的全栈优化 ...
未知机构:每日复盘128标普五连阳美元创四年新低黄金新高原油拉升A股震荡上-20260128
未知机构· 2026-01-28 02:45
Summary of Key Points from Conference Call Records Industry Overview - **Market Performance**: The S&P 500 experienced a five-day winning streak, reaching record highs before major tech earnings reports. The dollar hit a four-year low, while gold prices surged. A-shares showed a volatile upward trend, with significant gains in precious metals and the computing hardware supply chain [1][2]. Core Insights and Arguments - **Tech Sector Earnings**: Major tech companies are influencing market trends, with Meta's $60 billion order for fiber optics leading to a 15% surge in Corning's stock. Micron and Microsoft also saw stock increases of over 5% and 2%, respectively, while Tesla's stock fell by 1% [1]. - **Economic Indicators**: In December, profits for large-scale industrial enterprises in China shifted from a 13.1% decline in November to a 5.3% increase, indicating improved profitability and growth in the upper and middle reaches of the industrial sector [1]. - **Commodity Prices**: Gold prices rose over 3%, while silver experienced significant volatility, with a drop of over 10% and a subsequent rise of nearly 9% [1]. Important but Overlooked Content - **Sector-Specific Developments**: - **AI Applications**: The AI sector is seeing significant advancements, with new models expected to launch during the Spring Festival. Companies like Deepseek and Kimi are releasing new products, indicating a robust growth trajectory in AI applications [5][6]. - **Fiber Optics**: Meta's substantial investment in fiber optics is a key development, with potential implications for related companies such as Yangtze Optical Fibre and Hengtong Optic-Electric [6]. - **Aviation Industry**: China’s COMAC plans to increase production and delivery of the C919 narrow-body aircraft, suggesting a potential growth area in the domestic aviation market [6]. - **Semiconductors**: Price adjustments by Zhongwei Semiconductor for MCU and Norflash products, with increases ranging from 15% to 50%, highlight the ongoing demand and pricing power in the semiconductor sector [6]. - **Cloud Computing**: Google announced a price adjustment for data transmission methods in North America, which could significantly impact cloud service providers and related companies [6].
至少有九家中国AI芯片公司出货量超万卡
3 6 Ke· 2026-01-28 01:46
在严格的芯片出口管制的倒逼下,国产数据中心AI芯片的自主化进程正在加速。目前,国产AI芯片包括华为昇腾、百度昆仑芯、阿里平头哥、寒武纪等 十余个品牌。 《财经》多方调研获悉,至少有九家中国AI芯片公司的出货量或订单量已超过1万卡。其中包括华为昇腾、百度昆仑芯等背靠科技大厂的企业,还包括寒 武纪、沐曦、天数智芯、燧原科技等AI芯片上市和将上市企业,甚至包括曦望(Sunrise)、清微智能等仍在创业阶段的非上市公司。 其中出货规模大的AI芯片公司,累计出货量已在10万卡级别。出货量相对较小的AI芯片公司,如曦望、清微智能等2025年出货量或订单规模在1万卡以 上。 国产推理AI芯片单价目前单卡价格约在3万-20万元不等。出货量或订单量达到万卡规模,这说明国产AI芯片的性能、稳定性和总拥有成本具备一定市场 认可度。它开启的不只是规模竞争,更是围绕稳定性、软件生态和商业化服务的更深层次、更全方位的竞争。 一批大大小小的AI芯片公司出货规模快速增长,国产AI芯片的市场份额因此迅速攀升。 国际市场调研机构IDC 2025年10月数据显示,2025年上半年中国加速(即AI芯片)服务器市场规模达到160亿美元,出货超过190 ...
推理需求爆发,国产芯片从“堆算力”转向系统协同
Di Yi Cai Jing· 2026-01-27 12:00
国产算力正处于一个非常有利的位置。 且训推一体芯片也存在一定问题,曦望联席CEO王勇将其总结为三大困境:成本高昂,供应不稳定;能耗惊人;部署运维复杂。未来,合理的算力访存比才 是芯片竞争的关键。算力访存比是衡量芯片算力与数据传输能力匹配度的核心指标。 过去芯片行业竞争的核心是"堆算力",随着推理算力需求爆发,"内存墙"逐渐成为芯片性能的主要瓶颈。计算单元的算力提升速度远快于访存带宽的提升速 度,导致大多数芯片的纸面算力无法在实际场景中释放,这一矛盾在推理芯片中尤为突出。为应对该挑战,英伟达创始人黄仁勋提出从单芯片优化升级为系 统级协同设计的方案,这也是Vera Rubin平台的核心设计逻辑。 王勇也有类似观察,他对记者表示,现在的大模型公司以DeepSeek为代表,不仅会做大模型,也会牵引框架变化,带动从模型架构到算子开发、推理系统 的全链路技术创新,推动框架适配新计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的依赖。此次曦望也发布了AI算力平台,以自研芯片为底座,与 多家大模型进行适配,从系统侧提高芯片利用效率。 炜烨智算董事长兼CEO周韡韡表示,国产芯片定位越来越准确——从最初盲目追求与国际高性能算力 ...
曦望发布新一代推理GPU芯片启望S3,单位Token推理成本降低90%
Xin Lang Cai Jing· 2026-01-27 11:36
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:智通财经) 启望S3为面向大模型推理的定制化GPGPU芯片。智通财经记者了解到,其在典型推理场景下的整体性 价比较上一代提升超10倍。算力与存储设计上,该芯片支持FP16至FP4精度切换,采用LPDDR6显存方 案,显存容量提升4倍。在DeepSeek V3/R1满血版等主流大模型推理中,单位Token成本较上一代降低约 90%。 1月27日,智通财经记者获悉,国产GPU厂商曦望(Sunrise)发布新一代推理GPU芯片启望S3。这是曦 望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年,曦望芯片交付量已突破万片。 ...