S3产品矩阵
Search documents
曦望发布推理GPU芯片启望S3 推进推理云生态共建
Zheng Quan Ri Bao Wang· 2026-01-28 12:53
本报讯 (记者袁传玺)1月27日,专注于推理GPU的曦望(Sunrise)在杭州举办首届Sunrise GPU Summit,发布新一代推理GPU芯片"启望S3",并披露其围绕推理场景构建的算力产品体系及共建推理 云生态计划。这也是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。 王勇表示,曦望的推理GPU并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化 设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件 体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖ModelScope平台90%以上主流大模型形 态。 围绕启望S3,曦望同步发布了面向大模型推理的寰望SC3-256超节点方案,可高效支撑PD分离架构与大 规模专家并行(EP)部署,适配千亿、万亿级参数的多模态MoE推理场景。 同时,曦望还推出覆盖PCIe、OAM模组、一体机及AI计算集群在内的S3产品矩阵,覆盖从单机推理到 大规模集群部署的多样化需求。 值得关注的是,曦望通过生态共建推理云被视为其推理算力体系中的关键一环。依托自研推理GPU,曦 望实现从底层芯片到上层平台的全栈优化 ...