Workflow
Token as a Service
icon
Search documents
从拼模型到算成本,曦望用S3 GPU给出最佳答案
半导体芯闻· 2026-01-29 10:10
更大的模型、更高端的GPU、更密集的算力投入,构成了这一阶段最鲜明的特征。训练能力一度 等同于技术先进性,也决定了厂商在产业链中的话语权。但随着大模型规模趋于稳定、训练节奏 放缓,AI系统的主要负载正在发生转移。真正被频繁调用、持续消耗算力的,不再是一次性的模 型训练,而是无处不在、实时发生的推理请求。 在 AI 产 业 从 训 练 走 向 推 理 的 关 键 转 折 点 , 曦 望 科 技 于 2026 年 1 月 27 日 举 办 首 届 Sunrise GPU Summit产品发布会,正式发布新一代推理GPU芯片启望S3,并同步推出寰望SC3超节点解决方 案及推理云计划。这是曦望在完成近30亿元战略融资后的首次系统性技术亮相。 如果您希望可以时常见面,欢迎标星收藏哦~ 过去两年,AI产业的重心高度集中在训练。 在发布会上,中国工程院院士、浙江大学信息学部主任吴汉明出席发表致辞并指出,当前国内正 处于集成电路与人工智能深度融合的关键时期,算力作为核心生产力,关系到科技自立自强战略 的落实。 "AI规模化应用对算力提出了前所未有的要求,传统芯片已难以满足多场景下的高效能需求。"吴 汉明强调,推理算力价值的实 ...