Workflow
百舸AI异构计算平台4.0
icon
Search documents
百度智能云成功点亮昆仑芯三代万卡集群:国内首个正式点亮的自研万卡集群
IPO早知道· 2025-02-05 14:02
作者|C叔 微信公众号|ipozaozhidao 据IPO早知道消息,百度智能云日前成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研 万卡集群。据悉,百度智能云将进一步点亮3万卡集群。 将于近日点亮3万卡集群。 本文为IPO早知道原创 这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步,不仅为百度自身的技术发展提供了 强大动力,也为整个中国科技界、互联网行业和AI行业带来了新的发展机遇。 万卡集群的建成不仅为百度带来了强大的算力支持,还推动了模型降本的趋势。在过去一年中,整个 行业都在努力降低大模型的使用成本,而算力紧张是导致成本居高不下的重要因素之一。百度通过自 研芯片和大规模集群的建设,不仅解决了自身算力供应的问题,还为整个行业提供了新的思路和方向 。 从算力上看,超大规模并行计算能力可实现训练效率跃升,万卡集群可将千亿参数模型的训练周期大 幅降低,满足AI原生应用快速迭代的需求。同时也能支持更大模型与复杂任务和多模态数据,支撑 Sora类应用的开发。此外,万卡集群能够支持多任务并发能力,通过动态资源切分,单集群可同时 训练多个轻量化模型,通过通信优化与容错机制减少算力浪费,实现训练成本指数 ...
百度沈抖:AI应用在B端率先爆发,亟需新型AI基础设施
IPO早知道· 2024-11-12 10:58
大模型进入深度应用期。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,以"应用来了"为主题的百度世界2024于11月12日在上海召开。 另一方面,10万卡规模超大集群需要占据大概10万平方米空间,相当于13个标准足球场;每天则要 消耗大约300万千瓦时的电力,相当于北京市东城区一天的居民用电量。这种对于空间和能源的巨大 需求,远超传统机房部署的承载能力,而跨地域机房部署又会给网络通信带来巨大挑战。 通过设计高效的网络拓扑结构,结合模型切分优化和跨地域无拥塞高性能网络方案,百舸能够在横跨 几十公里的多机房组成的万卡规模的集群上,将单一模型训练任务的性能折损控制在4%以内,达到 业界最领先水平。 本文由公众号IPO早知道(ID:ipozaozhidao)原创撰写,如需转载请联系C叔↓↓↓ 目前,百度智能云拥有中国最大的大模型产业落地规模。超过六成的央企和大量的民营企业,正在联 合百度智能云进行AI创新。百度智能云千帆大模型平台已经帮助客户精调了3.3万个模型、开发了77 万个企业应用、文心大模型日均调用量超过15亿次。 百度集团执行副总裁、百度智能云事 ...