Workflow
推理云生态
icon
Search documents
曦望发布启望S3推理成本较上一代降约90%,押注「极致性价比」GPU与算力新范式
IPO早知道· 2026-01-29 00:15
2025年芯片交付量已突破万片。 本文为IPO早知道原创 作者| 苏打 微信公众号|ipozaozhidao 在大模型产业从"训练驱动"走向"推理驱动"的关键拐点上,国产GPU厂商正重新审视算力的商业价 值与交付方式。 据IPO早知道消息,1 月 27 日,曦望(Sunrise)于首届Sunrise GPU Summit中,正式发布新一 代推理GPU芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也 是曦望在近一年累计完成约30亿元战略融资后首次集中公开亮相。 曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI产业正从"训练驱动"转向"推理驱动"。 相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。 "谁能持续降低推理成本,谁就掌握了AI产业的成本曲线。"他指出, 曦望并不希望只做一家卖芯片 的公司,而是围绕推理场景,构建"芯片+系统+生态"的整体布局,让推理算力真正成为可规模化、 可持续的基础设施。 2025年,专注于推理GPU的曦望芯片交付量已突破万片。 徐冰表示,希望通过推理算力体系的系 统性创新,助力AI应用实现规模化落地与可持续增长。 S3继续强 ...
曦望发布推理GPU芯片启望S3 推进推理云生态共建
Zheng Quan Ri Bao Wang· 2026-01-28 12:53
本报讯 (记者袁传玺)1月27日,专注于推理GPU的曦望(Sunrise)在杭州举办首届Sunrise GPU Summit,发布新一代推理GPU芯片"启望S3",并披露其围绕推理场景构建的算力产品体系及共建推理 云生态计划。这也是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。 王勇表示,曦望的推理GPU并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化 设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件 体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖ModelScope平台90%以上主流大模型形 态。 围绕启望S3,曦望同步发布了面向大模型推理的寰望SC3-256超节点方案,可高效支撑PD分离架构与大 规模专家并行(EP)部署,适配千亿、万亿级参数的多模态MoE推理场景。 同时,曦望还推出覆盖PCIe、OAM模组、一体机及AI计算集群在内的S3产品矩阵,覆盖从单机推理到 大规模集群部署的多样化需求。 值得关注的是,曦望通过生态共建推理云被视为其推理算力体系中的关键一环。依托自研推理GPU,曦 望实现从底层芯片到上层平台的全栈优化 ...