Workflow
第四范式(06682)发布“Virtual VRAM”虚拟显存扩展卡 GPU资源利用率实现突破
FOURTH PARADIGMFOURTH PARADIGM(HK:06682) 智通财经网·2025-09-30 01:39

该产品主要面向两大应用场景:一是在大模型单卡运行显存不足时,用户可通过调用内存资源继续完成 任务,从而避免采购额外显卡,显著降低成本;二是在轻负载场景中,可将多个模型部署于同一GPU, 实现资源动态调度,有效解决"一模型一卡"带来的资源闲置问题。 此外,"Virtual VRAM"具备高度兼容性与部署便利性。产品支持物理机、Docker容器及Kubernetes等云 原生环境,用户无需修改现有代码或重新编译即可实现即插即用,大幅降低了部署复杂度和二次开发成 本。 分析认为,随着AI模型数量与参数规模持续高速增长,显存容量已成为制约企业AI能力构建与成本控 制的关键因素。第四范式此次发布的新产品,有望为企业提供更具性价比的算力扩展方案,帮助用户在 保持高性能的同时进一步实现降本增效。未来,第四范式计划与更多内存厂商展开合作,持续推动AI 基础设施的优化与普及。 传统GPU显存容量固定且扩展成本高昂,限制了AI模型规模的扩大与多任务并发能力。用户往往只能 通过购置更高端显卡或多卡并行来缓解压力,导致投入成本急剧上升。第四范式的"Virtual VRAM"创新 性地构建了显存与内存之间的高速数据通道,将内存虚拟为显 ...