训推一体GPU - filings, earnings calls, financial reports, news

训推一体GPU

Search documents

2 1 Shi Ji Jing Ji Bao Dao· 2026-02-02 09:56

2025年，全球大模型token消耗量涨了100倍。每一笔消耗都意味着一次AI推理，而每一次推理的成本，正在成为AI公司能否盈利的关键。根据德勤报告，到2026年，推理算力在整体AI计算中的占比将超过训练，达到66%。大模型从"被训练出来"走向"被用起来"，推理从技术配角变成了商业主力。 "训练市场是头部玩家的游戏，门槛越来越高，收敛得很快。"曦望董事长徐冰在采访中向21世纪经济报道记者表示，"但推理是百花齐放的，需求看不到天花板。" 日前，曦望发布了公司新一代推理GPU——启望 S3。这家公司脱胎于商汤科技大芯片部门的公司，于2025年初独立运营，一年内完成近30亿元战略融资，股东阵容兼具产业龙头与国资背景机构。曦望选择了一条看似窄众的道路：All in推理，放弃训练。这在GPU公司竞相标榜"训推一体"或"算力领先"的语境里，像是一次主动的战略收缩，而管理层认为这是聚焦。国产AI芯片赛道正在进入一个更务实、更分化的新阶段。这背后，既有对市场趋势的预判，也有在现有技术、生态和供应链约束下的务实考量。 "大模型的训练需要万卡甚至十万卡的大规模集群，成本极高，是少数巨头的游戏。而用为训练优化的昂 ...

沐曦股份：公司训推一体GPU具备国内领先的计算能力

Zheng Quan Ri Bao Wang· 2026-01-19 13:40

证券日报网讯1月19日，沐曦股份在互动平台回答投资者提问时表示，公司训推一体GPU具备国内领先的计算能力，拥有丰富的标量、矢量和张量计算单元，支持多精度计算，能够满足人工智能训练和推理、通用计算、科学计算等多元化的算力需求，大幅提升了智算集群的多场景融合应用能力。同时，公司是全球少数几家掌握了复杂多级缓存结构的GPU企业，凭借独特的缓存组网技术，能够针对不同场景灵活自适应多级缓存控制策略，实现对高速缓存的精细管控、有效提升缓存命中率，满足GPU高算力下对于高带宽的需求。智算推理GPU曦思N系列产品是公司于2022年推出的首款产品，定位为应用于人脸识别、图像识别、文本分类等传统人工智能推理场景的算力芯片。公司曦思N100产品系面向传统人工智能场景，内置性能强劲的视频处理器和运算核心，可广泛应用于智慧城市、智慧交通、智慧教育、智能视频处理等场景；公司曦思N系列后续迭代产品(N260与N300系列(在研))系面向生成式人工智能场景，拥有多精度混合算力、大容量显存和较高的能效比，可广泛应用于大模型推理、生成式应用等场景。 ...

MetaX Integrated Circuits (Shanghai)(SH:688802)