Workflow
异构算力协同
icon
Search documents
中国电信完成业界首个面向大模型推理的异构算力协同技术验证
Xin Lang Cai Jing· 2025-10-13 23:42
技术验证的成功体现了中国电信对智算推理优化技术的深刻理解与对国产算力适配调优的实践创新,彰 显了中国电信作为算力基础设施建设方推动国产算力从"可用"到"好用"的央企担当。未来,中国电信将 持续深化国产算力高质量发展布局,面向大模型训推一体、多智能体系统打造"互联互通、高效协同"的 异构算力生态格局,推动新型信息基础设施协调发展。 针对推理Prefill与Decode阶段特性优化芯片设计逐渐成为行业共识,英伟达和华为分别发布芯片设计规 划,将PD两阶段分别适用"高算低存"和"低算高存"的思路融于芯片设计。中国电信研究院在2025年初 洞察到PD分离推理对算力异质性的需求,构建异构通信优化、PD资源调配、推理任务调度全栈自研异 构混推体系,展现出三大核心优势:一是通过自研异构传输引擎,实现跨架构芯片PD池间KVCache的 高效传输;二是采用自研国产算力赋能工具"翼芯",根据业务特征与算力性能自动推荐并实时优化PD 资源配比;三是构建AI推理平台,实现推理任务在Prefill池与Decode池间的动态调度。 本报讯(记者翼研)近期,中国电信研究院联合北京智源人工智能研究院、昆仑芯科技有限公司、中兴 通讯、北京基流 ...