Workflow
DeepEP通信框架
icon
Search documents
AI动态汇总:英伟达Llama-Nemotron模型表现优异,小米Mi-BRAG智能引擎亮相
China Post Securities· 2025-05-14 13:08
证券研究报告:金融工程报告 研究所 分析师:肖承志 SAC 登记编号:S1340524090001 Email:xiaochengzhi@cnpsec.com 研究助理:冯昱文 SAC 登记编号:S1340124100011 Email:fengyuwen@cnpsec.com 近期研究报告 《通义千问发布 Qwen-3 模型, DeepSeek 发布数理证明大模型——AI 动态汇总 20250505》 - 2025.05.06 《基金 Q1 加仓有色汽车传媒,减仓电 新食饮通信——公募基金 2025Q1 季报 点评》 - 2025.04.30 《泛消费打开连板与涨幅高度,ETF 资 金平铺机器人、人工智能与芯片—— 行业轮动周报 20250427》 - 2025.04.28 《国家队交易特征显著,短期指数仍 交易补缺预期,TMT 类题材仍需等待— —行业轮动周报 20250420》 - 《英伟达召开 GTC 2025 大会, Skywork-R1V、混元 T1 等推理模型接 2025.04.21 《小市值持续,高低波风格交替—— 中邮因子周报 20250413》 - 2025.04.14 《4 月是否还会有 ...
提升大模型通信性能30% DeepSeek致谢腾讯大模型网络提速技术方案贡献
Shen Zhen Shang Bao· 2025-05-11 22:32
【深圳商报讯】(记者陈姝)记者日前获悉,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行 深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信框架性能在RoCE网络 环境提升100%,在IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。相关技术 方案获得了DeepSeek公开致谢,称这是一次"huge speedup"代码贡献。 其次,腾讯还着力解决了GPU通信中的CPU控制瓶颈问题。通过基于IBGDA技术的优化,腾讯使得"控 制面"场景的操作也可以绕过CPU的"中转",进一步降低了延迟和能耗,提升了整体通信效率。 同时,针对GPU直接"对话"时存在的传输顺序混乱难题,腾讯提出了"QP内时序锁"机制,使得多个 GPU间的数据传输能够精准、按顺序完成,即使同时处理1000多个数据传输任务,DeepEP也能自动理 顺先后顺序。 在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原 有通信效率再提升30%。 目前该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构 建的高 ...
AI周报 | xAI新一轮融资后估值有望超1200亿美元;OpenAI重组计划生变
Di Yi Cai Jing Zi Xun· 2025-05-11 01:39
点评:数据提供商 PitchBook 的数据显示,如果达成,这将成为历史上第二大规模的初创公司融资,仅 次于其竞争对手OpenAI 今年早些时候获得的400亿美元融资,彼时融资后OpenAI估值达 3000 亿美元 (约合人民币2.17万亿元)。 OpenAI重组计划生变,非营利组织保持主导 xAI 洽谈新一轮融资,估值有望超过1200亿美元 5 月 9 日消息,有消息称,埃隆・马斯克旗下 AI 初创公司 xAI 正就新一轮融资进行谈判,其估值可能 达到 1200 亿美元(约合人民币8687.6亿元)。据知情人士透露,目前 xAI 谈判尚处于早期阶段,随着 谈判推进,xAI 的估值仍可能上下波动。投资者正探讨向该公司注资 200亿美元的事宜,但具体金额也 可能调整。 北京时间5月6日,OpenAI在官网发布公开信,宣布公司将继续由非营利组织控制,由此撤回了去年12 月提出的重组计划,在该计划中非营利组织本应在保留业务股份的同时,失去控制作用,由营利实体运 营管理公司,以达到更容易筹款的目的。 根据更新后的提案,OpenAI的营利性有限责任公司(for-profit LLC)将转变为像 Anthropic和xA ...