DeepEP

Search documents
AI动态汇总:英伟达Llama-Nemotron模型表现优异,小米Mi-BRAG智能引擎亮相
China Post Securities· 2025-05-14 13:08
证券研究报告:金融工程报告 研究所 分析师:肖承志 SAC 登记编号:S1340524090001 Email:xiaochengzhi@cnpsec.com 研究助理:冯昱文 SAC 登记编号:S1340124100011 Email:fengyuwen@cnpsec.com 近期研究报告 《通义千问发布 Qwen-3 模型, DeepSeek 发布数理证明大模型——AI 动态汇总 20250505》 - 2025.05.06 《基金 Q1 加仓有色汽车传媒,减仓电 新食饮通信——公募基金 2025Q1 季报 点评》 - 2025.04.30 《泛消费打开连板与涨幅高度,ETF 资 金平铺机器人、人工智能与芯片—— 行业轮动周报 20250427》 - 2025.04.28 《国家队交易特征显著,短期指数仍 交易补缺预期,TMT 类题材仍需等待— —行业轮动周报 20250420》 - 《英伟达召开 GTC 2025 大会, Skywork-R1V、混元 T1 等推理模型接 2025.04.21 《小市值持续,高低波风格交替—— 中邮因子周报 20250413》 - 2025.04.14 《4 月是否还会有 ...
提升大模型通信性能30% DeepSeek致谢腾讯大模型网络提速技术方案贡献
Shen Zhen Shang Bao· 2025-05-11 22:32
【深圳商报讯】(记者陈姝)记者日前获悉,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行 深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信框架性能在RoCE网络 环境提升100%,在IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。相关技术 方案获得了DeepSeek公开致谢,称这是一次"huge speedup"代码贡献。 其次,腾讯还着力解决了GPU通信中的CPU控制瓶颈问题。通过基于IBGDA技术的优化,腾讯使得"控 制面"场景的操作也可以绕过CPU的"中转",进一步降低了延迟和能耗,提升了整体通信效率。 同时,针对GPU直接"对话"时存在的传输顺序混乱难题,腾讯提出了"QP内时序锁"机制,使得多个 GPU间的数据传输能够精准、按顺序完成,即使同时处理1000多个数据传输任务,DeepEP也能自动理 顺先后顺序。 在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原 有通信效率再提升30%。 目前该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构 建的高 ...
AI周报 | xAI新一轮融资后估值有望超1200亿美元;OpenAI重组计划生变
Di Yi Cai Jing Zi Xun· 2025-05-11 01:39
点评:数据提供商 PitchBook 的数据显示,如果达成,这将成为历史上第二大规模的初创公司融资,仅 次于其竞争对手OpenAI 今年早些时候获得的400亿美元融资,彼时融资后OpenAI估值达 3000 亿美元 (约合人民币2.17万亿元)。 OpenAI重组计划生变,非营利组织保持主导 xAI 洽谈新一轮融资,估值有望超过1200亿美元 5 月 9 日消息,有消息称,埃隆・马斯克旗下 AI 初创公司 xAI 正就新一轮融资进行谈判,其估值可能 达到 1200 亿美元(约合人民币8687.6亿元)。据知情人士透露,目前 xAI 谈判尚处于早期阶段,随着 谈判推进,xAI 的估值仍可能上下波动。投资者正探讨向该公司注资 200亿美元的事宜,但具体金额也 可能调整。 北京时间5月6日,OpenAI在官网发布公开信,宣布公司将继续由非营利组织控制,由此撤回了去年12 月提出的重组计划,在该计划中非营利组织本应在保留业务股份的同时,失去控制作用,由营利实体运 营管理公司,以达到更容易筹款的目的。 根据更新后的提案,OpenAI的营利性有限责任公司(for-profit LLC)将转变为像 Anthropic和xA ...
DeepSeek致谢腾讯技术团队:对DeepEP的优化,是一次“huge speedup”代码贡献
Xin Lang Ke Ji· 2025-05-07 11:12
| Pull requests | | | | --- | --- | --- | | | | Support multi-QP for normal kernels #130 | | - Merged | | LyricZhao merged 9 commits into main from trom trom /internade multi op c 2 weeks ago | | Conversation a | | - Conveits . A Chacks a [t] Files changed 7 | | | | LyricZhao commented 2 weeks ago · edited + Collaborator | | huge speedup: | | This PR is authored by Teneent Netweek Platform Department. Thanks for the centribution! Now normal kernels have a | | Type | | Dispatch #EP Bottleneck bandwidth Combi ...
【兴证计算机】DeepSeek跟踪:AI平权领军,加力开源及降价
兴业计算机团队· 2025-03-02 11:41
点击上方"公众号"可订阅哦! 兴业证券计算机小组 使用本研究报告的风险提示及法律声明 周观点 坚定中长期信心,在调整中加仓核心龙头 坚定中长期信心,在调整中加仓核心龙头。 本周,受前期上涨较快及业绩快报披露等因素影响,板块出现一定的 调整。展望后市,快报已披露完毕,即将进入重要的政策窗口期,同时 2025Q1 业绩改善值得期待。建议围绕政 策及技术两大维度,积极加仓核心赛道龙头,主要包括人工智能及国产化。 全球 AI 产业正加速共振,继续超配 AI 赛道。 在国内, DeepSeek 本周开源了包括 DeepEP 、 DeepGEMM 等在内的一系列解决方案,覆盖从底层硬件优化到上层应用多环节;同时,实施"错峰定价"策略,大幅下调夜间 空闲时段的 API 调用价格,有望加速 AI 应用发展。在海外, OpenAI 本周发布 ChatGPT 4.5 ,其在人性化交 互方面实现明显提升。今年以来,自从包括豆包、 DeepSeek 在内的国产大模型突破以来,全球 AI 产业的共振 正在加速,产业趋势不断发酵。建议持续超配。 本文第二章,对 AI 平权领军 DeepSeek 的业务进展进行了重点跟踪。 风险提示: 板 ...
【兴证计算机】DeepSeek跟踪:AI平权领军,加力开源及降价
兴业计算机团队· 2025-03-02 11:41
点击上方"公众号"可订阅哦! 兴业证券计算机小组 蒋佳霖/孙乾/陈鑫/杨本鸿/张旭光/杨海盟/桂杨 本周观点聚焦 1、本周 观 点: 坚定中长期信心,在调整中加仓核心龙头 2、深度跟 踪: DeepSeek 跟踪: AI 平权领军,加力开源及降价 周观点 坚定中长期信心,在调整中加仓核心龙头 坚定中长期信心,在调整中加仓核心龙头。 本周,受前期上涨较快及业绩快报披露等因素影响,板块出现一定的调整。展望后市,快报已披露完毕,即将进入重要的政 策窗口期,同时 2025Q1 业绩改善值得期待。建议围绕政策及技术两大维度,积极加仓核心赛道龙头,主要包括人工智能及国产化。 全球 AI 产业正加速共振,继续超配 AI 赛道。 在国内, DeepSeek 本周开源了包括 DeepEP 、 DeepGEMM 等在内的一系列解决方案,覆盖从底层硬件优化到上层应 用多环节;同时,实施"错峰定价"策略,大幅下调夜间空闲时段的 API 调用价格,有望加速 AI 应用发展。在海外, OpenAI 本周发布 ChatGPT 4.5 ,其在人性化交互 方面实现明显提升。今年以来,自从包括豆包、 DeepSeek 在内的国产大模型突破以来, ...
【电子】DeepSeek驱动模型平权,英伟达Blackwell加速出货——光大证券科技行业跟踪报告之二(刘凯)
光大证券研究· 2025-03-01 13:53
点击注册小程序 特别申明: (1)Anthropic公司最新推出Claude3.7Sonnet;(2)阿里云Qwen团队推出了全新推理模型系统"深度思考 (QwQ)";(3)DeepSeek开源DeepEP代码;(4)特斯拉FSD入华与小米全场景智驾上线,智能驾驶有 望成为AI应用落地的焦点。 AI:阿里投资巨额资金用于云和AI硬件基础设施建设,腾讯元宝宣布同时支持混元和DeepSeek两大模型 阿里巴巴集团CEO吴泳铭2025年2月24日宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬 件基础设施,总额超过去十年总和。这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大 规模投资纪录。腾讯旗下AI原生应用"元宝"上线仅月余,便超越字节跳动旗下"豆包",成为苹果应用商店 免费榜第二,下载量突破200万大关。 半导体:存储跌价即将结束,25Q2有望逐步回升 根据闪徳资讯,随着NANDFlash厂商积极减产以维持供需秩序,NAND Flash合同价有望于2025年第二季 度开始上涨,涨价趋势至少可持续至2025年底。宇瞻科技预计内存市场将在2025年末出现DDR4和DDR5 短缺。Deep ...
DeepSeek披露,一天成本利润率为545%
华尔街见闻· 2025-03-01 11:17
3月1日中午,DeepSeek在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本利润率关键信息。DeepSeek称,假定GPU租赁成本为2美元/小时,总 成本为87072美元/天……统计包括网页、App和API在内的所有负载,如果所有tokens全部按照DeepSeek-R1的定价计算,理论上一天的总收入为562027美元,成本 利润率为545%。 文章一经发出,不少网友纷纷在评论区@尤洋。尤洋是潞晨科技创始人。此前,尤洋公开表示,卖DeepSeek API(MaaS)每月亏本4亿元。该消息一度引起轰 动。目前,尤洋已回应称,"由于多人at我,我今天(3月1日)之内会直接地回复一下"。 理论上一天的成本利润率为545% 文章中,DeepSeek首次披露成本利润率关键信息。DeepSeek统计了在24小时统计时段内DeepSeek-V3和R1网页、App和API的所有负载,所有tokens按照DeepSeek- R1的定价,并假定GPU租赁成本为2美元/小时,总成本为87072美元一天。DeepSeek称理论上一天的成本利润率为545%。 其中,DeepSeek称,在最近的24小时里(北京时间2025 ...
DeepSeek宣布:活动正式收官
21世纪经济报道· 2025-02-28 08:46
2月2 8日,国内AI明星企业深度求索(De e pSe e k)为期五天的"开源周"活动正式收官。 "开源周"都发布了什么? 自2月2 4日启动以来,De e pSe e k "开源周"发布的五个项目涵盖了从计算、通信到存储的各个 方面。 2 月 2 4 日 : 首 个 开 源 的 代 码 库 为 F l a s h M L A , 这 是 针 对 H o p p e r G P U 优 化 的 高 效 M L A 解码内核,针对可变长度序列作了优化,目前已投入生产。 2 月 2 5 日 : 宣 布 将 D e e pEP 向 公 众 开 放 。 D e e pEP 是 用 于 M oE ( 混 合 专 家 ) 模 型 训 练 和 推 理 的 EP ( Ex p e rt P a r a l l e l ism , 专 家 并 行 ) 通 信 库 , 可 以 实 现 高 效 且 优 化 的 全 对 全 通信,支持包括F P 8在内的低精度运算,适配现代高性能计算需求。 2月2 6日:宣布开源D e e p G E M M。D e e p G E M M 是一个专为简洁高效的 F P 8 通用矩阵 乘 法 ( ...
DeepSeek开源打碎了谁的饭碗
虎嗅APP· 2025-02-27 10:17
出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 头图|视觉中国 DeepSeek开源,正在让一波中腰部AI公司、本土芯片公司尝到甜头。 企业大模型落地应用公司53AI创始人杨芳贤最近忙碌程度达到去年同期数倍:春节刚过,大量此前只是咨 询的客户,找到杨芳贤要求尽快进场构建AI应用。"在我们存量客户中,有一半以上都将基座模型切换到 DeepSeek了。"据悉,这些客户多为中大型民营企业。 另一家提供模型场景落地业务的公司创始人则告诉虎嗅,DeepSeek开源后,几个AI应用创业者论坛热火朝 天,人们普遍认为AI应用创业的春天提早来了。而这波热度也吹到了芯片圈,本土芯片头部公司相关人士 告诉虎嗅,来找他们寻求合作的在春节后环比增长了两倍。 但对于大模型六小虎来说,经历了过去一年商业模式的探索,2025年还没等到探索出成熟路线,开源又给 他们造成巨大冲击。 "唯独和DeepSeek做同样事情的人,对他们的冲击是最大的,比如过去一年经常提到的大模型'六小虎'", 常垒资本合伙管理人冯博向虎嗅透露。 某六小虎公司内部,从DeepSeek开源第一天开始,围绕是否开源已经出现激烈争论。摆在他们面前的困扰 是:开源,可能意味着整 ...