Workflow
让64张卡像一张卡!浪潮信息发布新一代AI超节点,支持四大国产开源模型同时运行
LCXXLCXX(SZ:000977) 量子位·2025-08-11 07:48

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 从DeepSeek R1到Kimi K2,从Qwen到GLM,国产开源模型不仅在Hugging Face热度榜等榜单上频频霸榜,更在推理能力、长文本处理、 多模态理解等关键指标上持续刷新纪录。 性能飞跃的背后是参数规模的急剧膨胀,当前主流开源模型的参数量已经突破万亿大关,DeepSeek-R1、Kimi-K2等模型动辄需要数TB的显 存空间。 更重要的是,随着Agentic AI(代理式人工智能)成为新范式,多模型协同和复杂推理链带来 计算与通信需求的爆炸式增长 。 面对这一挑战,浪潮信息发布了面向万亿参数大模型的超节点AI服务器 "元脑SD200" 。 并且在实际测试中,其64卡整机推理性能实现了超线性扩展,是真正意义上的算力聚合突破。 64张卡,1个超节点 元脑SD200将64张卡融合成一个 统一内存、统一编址的超节点 ,把"整机域"的边界重新划定在了多主机之上。 它 以3D Mesh开放架构为骨架,底层由自研的Open Fabric Switch贯通 ,将分散在多台主机里的本土GPU拉进同一个高速互连域。 在这个统一域里,通过 远端GPU虚拟映射技 ...