Communications Equipment

Search documents
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
雷峰网· 2025-06-09 13:37
万卡集群可用度达到98%,集群秒级快恢(训练+推理)。 编辑丨李希 01 引言 你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这些能力背后离 不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能从简单规则判断进化到能处理万亿参 数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而算力集群则是把上万台甚至几十万台计算机 像搭积木一样连接起来,形成一艘能承载巨量计算任务的 "算力航空母舰"。 当我们把上万台计算机整合成一个有机整体时,需要解决一系列世界级难题:如何让它们像精密钟表一样 协同工作?如何在部分设备故障时依然保持高效运行?如何快速修复大规模训练中的中断问题?接下来我 们将逐一揭秘这些支撑 AI 算力集群的关键特性,看看华为团队如何用工程智慧驯服这头算力巨兽。 02 超节点高可用: 24 小时不停工的智能工厂 就像医院的急诊系统必须时刻在线, AI 训练和推理也不能轻易中断。算力集群里每台计算机都有 "备用替 身",当某台机器出现故障(比如突然断电或硬件损坏),系统会立刻启动备用机接管任务,就像接力赛中 接力棒无缝传递,确保自动驾驶训练、语音 ...
Ciena Delivers Growth, But Not Value
Seeking Alpha· 2025-06-06 13:55
Core Insights - Ciena Corporation (NYSE: CIEN) provides essential hardware, software, and automation tools that facilitate the movement of large volumes of data across global networks with minimal lag, playing a critical role in maintaining internet stability [1] Company Overview - Ciena's products are utilized by telecom companies and hyperscalers, indicating its significant presence in the telecommunications and data management sectors [1]
全球AI景气延续或支撑光模块需求,通信ETF(515880)涨超1.2%
Mei Ri Jing Ji Xin Wen· 2025-06-05 04:13
6月5日,通信ETF(515880)涨超1.2%,全球AI景气延续或支撑光模块需求。 国信证券指出,全球AI行业景气度持续,互联网云厂商持续加大AI投入,资本开支同比大幅增 长,AI军备竞赛仍在持续。光模块需求呈现高景气度,Oracle、xAI等加大AI基建投入推动高速光模块 需求增长,CPO技术加速发展。5月通信板块表现强于大市,军工信息化、光模块光器件、卫星互联网 涨幅居前。我国商业航天加速发展,多地规划新建商业发射工位,政策推动下民营火箭研发和发射能力 快速提升。运营商经营稳健,分红比例持续提升,高股息价值凸显。 通信ETF(代码:515880)跟踪的是通信设备指数(代码:931160),该指数由中证指数有限公司 编制,从A股市场中选取涉及通信网络设备、终端设备及相关配套服务的上市公司证券作为指数样本, 聚焦通信设备制造业领域,旨在反映该行业上市公司证券的整体表现,具有鲜明的行业特征。 每日经济新闻 (责任编辑:董萍萍 ) 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容 的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担 ...
爆改大模型训练,华为打出昇腾+鲲鹏组合拳
虎嗅APP· 2025-06-04 10:35
《华为技术披露集》系列 VOL.10 :昇腾+鲲鹏 HUAWEI X HUXIU 三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的 「石器时代」中,为后世留下了变革的火种。 近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这 个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。 如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架 构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊 病,还能够降本增效,便于训练和部署。 AI之战远未终结,但正如在其他领域中「多快好省」的中国产业底色一样,大模型这棵生于 西方长于彼岸的科技树,也同样会被东方智慧经手后,进化为更加普适和亲切的工具。 近期,虎嗅将打造《华为技术披露集》系列内容,通过一连串的技术报告,首次全面披露相 关的技术细节。 希望本系列内容能为业界起到参考价值,也希望更多人能与华为一起,共同打造长期持续的 开放协作生态环境,让昇腾生态在中国茁壮成长。 在通往更强大的AI路上,MoE已成为科技巨头另一个首选路径。 只要Scal ...
上帝视角的昇腾MoE训练智能交通系统,Adaptive Pipe&EDPB让训练效率提升70%
华尔街见闻· 2025-06-03 13:05
随着大模型的迅猛发展,混合专家( MoE)模型凭借其独特的架构优势,成为扩展模型能力的重要 方向。MoE通过创新性的路由机制,动态地将输入token分配给不同的专家网络,不仅高效实现了模 型参数的规模化扩展,更在处理复杂任务时展现出显著优势。然而, 将 MoE模型在分布式集群环境 下进行训练时,训练效率不足,已成为亟待解决的难题。 实践 表明, MoE模型训练集群的效率面临两方面挑战:(1) 专家并行引入计算和通信等待 , 当 模型规模较大时,需要切分专家到不同设备形成并行( EP),这就引入额外 All-to-All 通信,同时 MoE层绝大部分EP通信与计算存在时序依赖关系, 一般的 串行执行模式 会 导致大量计算单元空闲 , 等待 通信;( 2) 负 载不均引入计算和计算等待 , MoE算法核心是"有能者居之",在训练过 程中会出现 部分热专家被频繁调用,而冷专家使用率较低 ;同时,真实训练数据的长度不一,不同 的模型层(如稀疏层、嵌入层等)的计算量也存在明显差异,造成不同卡之间计算也在互相等待。 形象地说, MoE训练系统就像一个交通拥塞严重的城区:1)人车混行阻塞,所有车辆(计算)必须 等待行人(通 ...
Ribbon Announces $50 Million Share Repurchase Program
Prnewswire· 2025-06-03 12:45
Core Viewpoint - Ribbon Communications Inc. has announced a share repurchase program of up to $50 million, reflecting the Board's confidence in the company's strategic plan and improved performance, particularly highlighted by record financial results in Q4 2024 [1][2]. Financial Performance - The company reported a 30% increase in earnings for 2024, achieving results at the high end of its original guidance [2]. - Business with US Tier One Service Providers doubled in 2024, supported by a multi-year contract with Verizon for modernizing telecom voice infrastructure [2]. Share Repurchase Program - The share repurchase program will commence on June 5, 2025, and continue through December 31, 2027 [1]. - The program may involve purchases in the open market, privately negotiated transactions, or structured through investment banking institutions, with the timing and amount subject to various factors [2]. Business Strategy and Outlook - The company has seen significant growth in business with Enterprise customers and U.S. Federal agencies [2]. - There is improved visibility in the business with positive book-to-bill ratios and a growing backlog, indicating a focus on driving profitable growth and strong cash flow generation [2]. Company Overview - Ribbon Communications provides secure cloud communications and IP optical networking solutions globally, focusing on modernizing networks for better competitive positioning [3]. - The company emphasizes its commitment to Environmental, Social, and Governance (ESG) matters, offering an annual Sustainability Report to stakeholders [3].
VIAV Solution Boosts Fiber Fault Detection Capabilities: Stock to Gain?
ZACKS· 2025-05-30 14:06
Core Insights - Viavi Solutions, Inc. is collaborating with 3-GIS to enhance fiber fault detection capabilities for enterprises, addressing the operational challenges of maintaining fiber infrastructure as it becomes critical for data communications [1][4] - The integration of Viavi's ONMSi Remote Fiber Test System with 3-GIS' geospatial capabilities aims to automate network issue detection and resolution, improving service quality and minimizing downtime [2][3] Industry Context - The demand for high-quality fiber connections is increasing as service providers face pressure to deliver consistent services for AI workloads and high-performance computing, making intelligent automated systems essential in the telecommunications industry [4] - Viavi's strategy includes expanding its product portfolio across various markets, which is expected to yield long-term benefits, particularly with the acquisition of Spirent Communications' high-speed ethernet and network security business [5] Company Performance - Viavi's stock has increased by 21.8% over the past year, although this is below the industry's growth of 35.4% [6]
AI创新实力彰显,中兴通讯星云大模型获推理榜总分第一!
和讯· 2025-05-30 10:24
图源: SuperCLUE 《中文大模型基准测评2025年5月报告》 安全双认证 , 打造企业级AI的"可信底座" 除技术性能领先外,Nebula Coder-V6率先通过国家级权威安全认证,成为业内少数拥有"双安全 认证"的大模型产品 。 2025年,全球AI大模型竞赛进入白热化阶段。中文大模型测评基准SuperCLUE最新发布的 《中文 大模型基准测评2025年5月报告》 显示:中兴通讯自主研发的星云大模型Nebula Coder-V6在竞 争激烈的推理专项榜单中强势摘金, 总分并列第一 ,同时在综合总榜中斩获银牌(并列第二),彰 显了中兴通讯在AI核心赛道的前沿创新实力。 图源: SuperCLUE 《中文大模型基准测评2025年5月报告》 推理能力登顶 , 数学与科学逻辑的"双优生" SuperCLUE推理榜单深度聚焦模型的逻辑思维与问题解决能力,涵盖数学推理、科学推理、代码生 成三大硬核维度。Nebula Coder-V6以总分67.4的优异成绩 登顶 ,其细分表现 也非常 亮眼:数 学推理 62.39分 , 在全部测评模型中高居第三,超越OpenAI o4-mini、谷歌Gemini 2.5 Pr ...
华为的准万亿大模型,是如何训练的?
虎嗅APP· 2025-05-30 10:18
现在,请大家一起数一下"1"、"2"。 OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了。 HUAWEI X HUXIU 三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的 「石器时代」中,为后世留下了变革的火种。 近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这 个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。 如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架 构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊 病,还能够降本增效,便于训练和部署。 AI之战远未终结,但正如在其他领域中「多快好省」的中国产业底色一样,大模型这棵生于 西方长于彼岸的科技树,也同样会被东方智慧经手后,进化为更加普适和亲切的工具。 近期,虎嗅将打造《华为技术披露集》系列内容,通过一连串的技术报告,首次全面披露相 关的技术细节。 希望本系列内容能为业界起到参考价值,也希望更多人能与华为一起,共同打造长期持续的 开放协作生态环境,让昇腾生态在中国茁壮成长。 《华 ...
华为AI实力!不用GPU,大模型每2秒吃透一道高数大题!
第一财经· 2025-05-30 09:32
现在,请大家一起 数一下"1"、"2" 。 而且啊,这个大模型还是 不用GPU 来训练,全流程都是大写的 "国产" 的那种。 这,就是华为通过 "昇腾+Pangu Ultra MoE" 这套组合拳解锁的效果—— OK,短短2秒钟时间,一个 准万亿MoE大模型 就已经 吃透 如何解一道 高等数学大题 了! 不仅实现了国产算力与国产模型全流程自主可控的训练闭环,更是在集群训练系统性能方面达到行业领先 水平。 有多领先?来看一组数据: · 预训练阶段:昇腾Atlas 800T A2万卡集群MFU提升至41% · 后训练阶段:单CloudMatrix 384超节点吞吐达35K Tokens/s 不用GPU的"炼"准万亿大模型方法 在深入华为Pangu Ultra MoE训练系统全流程之前,老规矩,我们还是先来了解一下此前的技术痛点。 整体来看,在当前的MoE预训练和强化学习后训练过程中所存在的挑战可以归结为六点: · 并行策略配置困难 :面对数据并行、张量并行、专家并行、流水线并行和序列并行等多种策略的组合 选择,加上稀疏激活导致的负载不平衡因素,很难通过人工经验找到最优的并行配置方案。 · All-to-All通信 ...