中国推理芯片突围与成本革命:破“内存墙”、兼容CUDA
21世纪经济报道记者 林典驰 深圳报道 当全球AI算力重心从训练加速转向推理,一场围绕性价比与能效的芯片战争正悄然爆发。 2025年以来,谷歌TPU v7高调锚定推理时代,英伟达重金整合Groq核心资产,行业共识已然形成:未 来五到十年,推理芯片将主导AI的演进方向。在这场历史性窗口期中,中国企业能否凭借场景优势、 工程创新与供应链韧性实现弯道超车? 2月3日,云天励飞(688343.SH)举办"大算力芯片战略前瞻会",首次对外公布未来三年的大算力 AI推 理芯片战略布局。 云天励飞董事长兼CEO陈宁表示,公司将核心研发资源集中于攻克大模型落地的"成本壁垒",致力于 通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向 普惠生产力。 过去一年,全球算力产业风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在2025年4月发布第 七代TPU"Ironwood"时,明确将其定位为"面向推理时代"的基石,强调在大规模推理与能效上的系统化 优化。 这一阶段的核心需求,已不再是依赖GPU、CUDA生态以及由数十万乃至百万张高性能计算卡互联所构 建的"绝对算力",而 ...