专注推理，放弃训练！一家中国GPU公司要差异化突围

2025年，全球大模型token消耗量涨了100倍。每一笔消耗都意味着一次AI推理，而每一次推理的成本，正在成为AI公司能否盈利的关键。根据德勤报告，到2026年，推理算力在整体AI计算中的占比将超过训练，达到66%。大模型从"被训练出来"走向"被用起来"，推理从技术配角变成了商业主力。 "训练市场是头部玩家的游戏，门槛越来越高，收敛得很快。"曦望董事长徐冰在采访中向21世纪经济报道记者表示，"但推理是百花齐放的，需求看不到天花板。" 日前，曦望发布了公司新一代推理GPU——启望 S3。这家公司脱胎于商汤科技大芯片部门的公司，于2025年初独立运营，一年内完成近30亿元战略融资，股东阵容兼具产业龙头与国资背景机构。曦望选择了一条看似窄众的道路：All in推理，放弃训练。这在GPU公司竞相标榜"训推一体"或"算力领先"的语境里，像是一次主动的战略收缩，而管理层认为这是聚焦。国产AI芯片赛道正在进入一个更务实、更分化的新阶段。这背后，既有对市场趋势的预判，也有在现有技术、生态和供应链约束下的务实考量。 "大模型的训练需要万卡甚至十万卡的大规模集群，成本极高，是少数巨头的游戏。而用为训练优化的昂 ...