GPU动态调度能力
Search documents
范式智能推动GPU动态调度新进展 助力云原生AI基础设施更高效
Zhi Tong Cai Jing· 2025-10-30 02:33
继上月发布"虚拟显存"技术引发行业对GPU资源灵活分配的关注后,范式智能近日再次发布GPU动态调度新进展——基于Kubernetes动态资源分配(DRA)的 GPU动态调度能力,实现对GPU算力与显存的一体化精细调度。该技术不仅是对用户关于"算力能否像显存一样动态切分"疑问的深入回应,更标志着GPU 资源管理从容量扩展迈向多维资源协同调度的新阶段。 随着Kubernetes v1.34的正式发布,其核心特性——动态资源分配(DRA)已稳定启用,标志着云原生资源调度进入更智能、更灵活的时代。 在这一背景下,范式智能基于长期在AI基础设施领域的积累,率先完成了HAMi-Core与DRA的深度适配,并推出GPU动态资源驱动(DRA Driver),让GPU 像CPU一样被灵活共享与调度,推动云原生算力管理体系不断完善与升级,为人工智能算力管理带来新的可能。 让GPU更灵活让算力更高效 在AI任务中,GPU是模型训练和推理的"引擎",但长期以来,传统使用方式常导致GPU资源浪费:要么"使用不满",要么"独占浪费"。 现在:用户可以"自选组合",根据任务需求自由搭配不同性能等级的GPU,就像同时选择"5、9、A"等不同 ...