Workflow
Token费用
icon
Search documents
国产GPU厂商放言:2030年百亿Token只要1分钱
是说芯语· 2026-03-08 03:30
在具体的产品上,他们设计了prefill与decode分离的系统架构,P芯片侧重计算密集,D芯片侧重访存密集,以此实现极致的 推理效率与极致性价比。 他们的GPNPU芯片也会有多个芯片协同的超节点,其中26年将推出第一代超节点P芯片, 算力对标NVIDAI的Hopper架构芯 片 ,27年则会推出第一代超节点D芯片,主打超低时延推理,对标NVIDAI的Blackwell架构芯片。 28年的第二代超节点D芯片则会对标NVIDIA的Rubin芯片 ,有望实现毫秒级推理时延。 2026年开年爆火的AI当属OpenClaw,被称为小龙虾的它可以充当7x24小时AI打工人,玩法非常多,但消耗的Token太多 了,很多人烧不起。 这也是最近2个月国产AI大模型调用超越了谷歌、OpenAI、Anthropic的原因,他们的Koken费用比国外便宜多了,但还是不 够便宜,要想解决这个问题还得需要大幅降低成本。 国产GPU初创企业云天励飞董事长兼CEO陈宁日前提出了一个新观点,表示未来5到10年全球AI竞争将从过去10年的谁最聪 明转向最能让AI应用大规模落地。 目前AI应用落地的瓶颈就在成本,Token费用是OpenClaw ...