集成多token联合预测 (MTP) 技术

Search documents
“GPU计算资源越来越异构”,腾讯全面适配主流国产芯片
Di Yi Cai Jing· 2025-09-16 04:11
"很多国产芯片在不断提升计算性能。" 在接受第一财经记者采访时,腾讯集团副总裁、政企业务总裁李强也谈到算力的效率问题。李强告诉记者,腾讯通过比较大的资本开支快速构建算力,以此 支持自研产品开发并为客户提供算力。从去年四季度到今年第二季度,腾讯累计资本开支达831亿元。但当算力没那么充裕的时候,效率变得非常重要。 "腾讯这些年有很多研发投入到算力优化领域。GPU只是一部分,还有存储、通信等很多方面,例如星脉网络可以提升近10倍的通信效率,当集群达到千 卡、万卡时,运行效率会发生很大变化。"李强表示,AI Infra(AI基础设施)提升能让成本效益变得更加明显。各云厂商在资本方面都有比较强的能力,最 终比拼的还是技术。 在AI Infra层,邱跃鹏还提到,AI Infra的升级可加速Agent(智能体)规模化落地。当前开源社区与推理相关的技术范式快速迭代,此前DeepSeek开源五大代 码库,为开源社区注入活力,腾讯也开源了多项核心技术,例如集成多token(词元)联合预测 (MTP) 技术可以让模型一次运算就生成多个token。 IDC中国研究总监刘丽辉告诉第一财经记者,云厂商依然保持多样化算力芯片的策略,除国 ...