云原生AI基础设施 - filings, earnings calls, financial reports, news

云原生AI基础设施

Search documents

Zheng Quan Shi Bao Wang· 2025-10-30 10:26

港股AI代表性公司第四范式技术再现新进展。在任务申请资源方面，可以根据需求选择不同配置的GPU，更精细、更灵活，相当于选牌方式从"固定套餐"到"自由组合"。继上月发布"虚拟显存"技术后，范式智能再次发布GPU动态调度新进展——基于Kubernetes动态资源分配(DRA)的GPU动态调度能力，实现对GPU算力与显存的一体化精细调度。该技术不仅是对用户关于"算力能否像显存一样动态切分"疑问的深入回应，也被视为GPU资源管理从容量扩展迈向多维资源协同调度的新阶段。 HAMi-Core作为由范式智能主导贡献的开源项目，致力于提升GPU在容器化和云原生环境下的利用率。此次适配工作让HAMi-Core与Kubernetes的动态资源调度能力实现了结合，让算力资源的申请、分配和释放都能通过标准化方式自动完成，降低使用门槛。这体现了范式智能在AI基础设施层面的技术深耕，也展示了其对开源生态的持续投入。随着Kubernetes v1.34的正式发布，其核心特性——动态资源分配(DRA)已稳定启用，标志着云原生资源调度进入更智能、更灵活的时代。目前范式智能已将该演示项目开源至GitHub(Project ...

范式智能推动GPU动态调度新进展助力云原生AI基础设施更高效

Zhi Tong Cai Jing· 2025-10-30 02:33

继上月发布"虚拟显存"技术引发行业对GPU资源灵活分配的关注后，范式智能近日再次发布GPU动态调度新进展——基于Kubernetes动态资源分配(DRA)的 GPU动态调度能力，实现对GPU算力与显存的一体化精细调度。该技术不仅是对用户关于"算力能否像显存一样动态切分"疑问的深入回应，更标志着GPU 资源管理从容量扩展迈向多维资源协同调度的新阶段。随着Kubernetes v1.34的正式发布，其核心特性——动态资源分配(DRA)已稳定启用，标志着云原生资源调度进入更智能、更灵活的时代。在这一背景下，范式智能基于长期在AI基础设施领域的积累，率先完成了HAMi-Core与DRA的深度适配，并推出GPU动态资源驱动(DRA Driver)，让GPU 像CPU一样被灵活共享与调度，推动云原生算力管理体系不断完善与升级，为人工智能算力管理带来新的可能。让GPU更灵活让算力更高效在AI任务中，GPU是模型训练和推理的"引擎"，但长期以来，传统使用方式常导致GPU资源浪费：要么"使用不满"，要么"独占浪费"。现在：用户可以"自选组合"，根据任务需求自由搭配不同性能等级的GPU，就像同时选择"5、9、A"等不同 ...

GPU动态资源驱动(DRA Driver)

GPU动态资源驱动(DRA Driver)