训推一体GPU
Search documents
专注推理,放弃训练!一家中国GPU公司要差异化突围
2 1 Shi Ji Jing Ji Bao Dao· 2026-02-02 09:56
2025年,全球大模型token消耗量涨了100倍。每一笔消耗都意味着一次AI推理,而每一次推理的成本,正在成为AI公司能否盈 利的关键。 根据德勤报告,到2026年,推理算力在整体AI计算中的占比将超过训练,达到66%。大模型从"被训练出来"走向"被用起来",推 理从技术配角变成了商业主力。 "训练市场是头部玩家的游戏,门槛越来越高,收敛得很快。"曦望董事长徐冰在采访中向21世纪经济报道记者表示,"但推理是 百花齐放的,需求看不到天花板。" 日前,曦望发布了公司新一代推理GPU——启望 S3。这家公司脱胎于商汤科技大芯片部门的公司,于2025年初独立运营,一年 内完成近30亿元战略融资,股东阵容兼具产业龙头与国资背景机构。 曦望选择了一条看似窄众的道路:All in推理,放弃训练。这在GPU公司竞相标榜"训推一体"或"算力领先"的语境里,像是一次 主动的战略收缩,而管理层认为这是聚焦。 国产AI芯片赛道正在进入一个更务实、更分化的新阶段。这背后,既有对市场趋势的预判,也有在现有技术、生态和供应链约 束下的务实考量。 "大模型的训练需要万卡甚至十万卡的大规模集群,成本极高,是少数巨头的游戏。而用为训练优化的昂 ...
沐曦股份:公司训推一体GPU具备国内领先的计算能力
Zheng Quan Ri Bao Wang· 2026-01-19 13:40
证券日报网讯1月19日,沐曦股份在互动平台回答投资者提问时表示,公司训推一体GPU具备国内领先 的计算能力,拥有丰富的标量、矢量和张量计算单元,支持多精度计算,能够满足人工智能训练和推 理、通用计算、科学计算等多元化的算力需求,大幅提升了智算集群的多场景融合应用能力。同时,公 司是全球少数几家掌握了复杂多级缓存结构的GPU企业,凭借独特的缓存组网技术,能够针对不同场景 灵活自适应多级缓存控制策略,实现对高速缓存的精细管控、有效提升缓存命中率,满足GPU高算力下 对于高带宽的需求。智算推理GPU曦思N系列产品是公司于2022年推出的首款产品,定位为应用于人脸 识别、图像识别、文本分类等传统人工智能推理场景的算力芯片。公司曦思N100产品系面向传统人工 智能场景,内置性能强劲的视频处理器和运算核心,可广泛应用于智慧城市、智慧交通、智慧教育、智 能视频处理等场景;公司曦思N系列后续迭代产品(N260与N300系列(在研))系面向生成式人工智能场 景,拥有多精度混合算力、大容量显存和较高的能效比,可广泛应用于大模型推理、生成式应用等场 景。 ...