云天励飞发布未来三年大算力芯片战略:目标把百万 Tokens 推理成本降低 100 倍以上
这些行业信号共同指向一个趋势:推理侧竞争已不再单纯是"把模型做得更强"的参数竞赛,而是"让应用跑得更久、更稳、更便宜"的效能竞赛,单位推理成 本与交付效率已成为规模化落地的最大门槛。 2月3日,云天励飞正式举办"大算力芯片战略前瞻会",首次对外公布未来三年的大算力 AI 推理芯片战略布局。面对人工智能从"基础模型构建"迈向"规模化 应用落地"的重要转折点,公司宣布将核心研发资源集中于攻克大模型落地的"成本壁垒",致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。 一、 产业变局:推理竞速,从"参数内卷"转向"效能为王" 过去一年,全球算力产业的风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在 2025 年 4 月发布第七代 TPU "Ironwood"时,明确将其定位为"面向 推理时代"的基石,强调在大规模推理与能效上的系统化优化。 与此同时,围绕"更低时延、更低成本"的推理芯片与系统能力,产业整合动作也在加速。2025 年 12 月,英伟达与 Groq 达成非独占许可安排,并吸纳其核 心工程人才团队加入,此举被视为强化推理与实时 ...