专注推理,放弃训练!一家中国GPU公司要差异化突围
2 1 Shi Ji Jing Ji Bao Dao·2026-02-02 09:56

2025年,全球大模型token消耗量涨了100倍。每一笔消耗都意味着一次AI推理,而每一次推理的成本,正在成为AI公司能否盈 利的关键。 根据德勤报告,到2026年,推理算力在整体AI计算中的占比将超过训练,达到66%。大模型从"被训练出来"走向"被用起来",推 理从技术配角变成了商业主力。 "训练市场是头部玩家的游戏,门槛越来越高,收敛得很快。"曦望董事长徐冰在采访中向21世纪经济报道记者表示,"但推理是 百花齐放的,需求看不到天花板。" 日前,曦望发布了公司新一代推理GPU——启望 S3。这家公司脱胎于商汤科技大芯片部门的公司,于2025年初独立运营,一年 内完成近30亿元战略融资,股东阵容兼具产业龙头与国资背景机构。 曦望选择了一条看似窄众的道路:All in推理,放弃训练。这在GPU公司竞相标榜"训推一体"或"算力领先"的语境里,像是一次 主动的战略收缩,而管理层认为这是聚焦。 国产AI芯片赛道正在进入一个更务实、更分化的新阶段。这背后,既有对市场趋势的预判,也有在现有技术、生态和供应链约 束下的务实考量。 "大模型的训练需要万卡甚至十万卡的大规模集群,成本极高,是少数巨头的游戏。而用为训练优化的昂 ...

专注推理,放弃训练!一家中国GPU公司要差异化突围 - Reportify