Workflow
AI算力资源利用
icon
Search documents
华为开源突破性技术Flex:ai,AI算力效率直升30%,GPU、NPU一起用
机器之心· 2025-11-22 04:12
机器之心报道 编辑:泽南 一举解决算力资源浪费。 不论是英伟达 GPU 还是昇腾的 NPU,都可以「融为一体」,动态切分了。 11 月 21 日,华为正式发布了 AI 容器技术 ——Flex:ai,同时,华为联合上海交通大学、西安交通大学与厦门大学共同宣布,将此项产学合作成果向外界开源,助 力破解算力资源利用难题。 据介绍,Flex:ai 深度融合了上海交通大学、西安交通大学、厦门大学三大高校与华为的科研力量,形成了三大核心技术突破: 针对 AI 小模型训推场景中「一张卡跑一个任务」可能造成的资源浪费问题,华为与上海交通大学联合研发 XPU 池化框架 ,可将单张 GPU 或 NPU 算力卡切分为 多份虚拟算力单元,切分粒度精准至 10%。 华为公司副总裁、数据存储产品线总裁周跃峰博士在发布会上表示,当前,AI 产业高速发展催生海量算力需求,但全球算力资源利用率偏低的问题日益凸显, 「算力资源浪费」成为产业发展的关键桎梏:小模型任务独占整卡导致资源闲置,大模型任务单机算力不足难以支撑,大量缺乏 GPU/NPU 的通用服务器更是处于 算力「休眠」状态,供需错配造成严重的资源浪费。 本次发布并开源的 Flex:ai ...