DeepGEMM

Search documents
【兴证计算机】DeepSeek跟踪:AI平权领军,加力开源及降价
兴业计算机团队· 2025-03-02 11:41
点击上方"公众号"可订阅哦! 兴业证券计算机小组 使用本研究报告的风险提示及法律声明 周观点 坚定中长期信心,在调整中加仓核心龙头 坚定中长期信心,在调整中加仓核心龙头。 本周,受前期上涨较快及业绩快报披露等因素影响,板块出现一定的 调整。展望后市,快报已披露完毕,即将进入重要的政策窗口期,同时 2025Q1 业绩改善值得期待。建议围绕政 策及技术两大维度,积极加仓核心赛道龙头,主要包括人工智能及国产化。 全球 AI 产业正加速共振,继续超配 AI 赛道。 在国内, DeepSeek 本周开源了包括 DeepEP 、 DeepGEMM 等在内的一系列解决方案,覆盖从底层硬件优化到上层应用多环节;同时,实施"错峰定价"策略,大幅下调夜间 空闲时段的 API 调用价格,有望加速 AI 应用发展。在海外, OpenAI 本周发布 ChatGPT 4.5 ,其在人性化交 互方面实现明显提升。今年以来,自从包括豆包、 DeepSeek 在内的国产大模型突破以来,全球 AI 产业的共振 正在加速,产业趋势不断发酵。建议持续超配。 本文第二章,对 AI 平权领军 DeepSeek 的业务进展进行了重点跟踪。 风险提示: 板 ...
【兴证计算机】DeepSeek跟踪:AI平权领军,加力开源及降价
兴业计算机团队· 2025-03-02 11:41
点击上方"公众号"可订阅哦! 兴业证券计算机小组 蒋佳霖/孙乾/陈鑫/杨本鸿/张旭光/杨海盟/桂杨 本周观点聚焦 1、本周 观 点: 坚定中长期信心,在调整中加仓核心龙头 2、深度跟 踪: DeepSeek 跟踪: AI 平权领军,加力开源及降价 周观点 坚定中长期信心,在调整中加仓核心龙头 坚定中长期信心,在调整中加仓核心龙头。 本周,受前期上涨较快及业绩快报披露等因素影响,板块出现一定的调整。展望后市,快报已披露完毕,即将进入重要的政 策窗口期,同时 2025Q1 业绩改善值得期待。建议围绕政策及技术两大维度,积极加仓核心赛道龙头,主要包括人工智能及国产化。 全球 AI 产业正加速共振,继续超配 AI 赛道。 在国内, DeepSeek 本周开源了包括 DeepEP 、 DeepGEMM 等在内的一系列解决方案,覆盖从底层硬件优化到上层应 用多环节;同时,实施"错峰定价"策略,大幅下调夜间空闲时段的 API 调用价格,有望加速 AI 应用发展。在海外, OpenAI 本周发布 ChatGPT 4.5 ,其在人性化交互 方面实现明显提升。今年以来,自从包括豆包、 DeepSeek 在内的国产大模型突破以来, ...
DeepSeek披露,一天成本利润率为545%
华尔街见闻· 2025-03-01 11:17
3月1日中午,DeepSeek在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本利润率关键信息。DeepSeek称,假定GPU租赁成本为2美元/小时,总 成本为87072美元/天……统计包括网页、App和API在内的所有负载,如果所有tokens全部按照DeepSeek-R1的定价计算,理论上一天的总收入为562027美元,成本 利润率为545%。 文章一经发出,不少网友纷纷在评论区@尤洋。尤洋是潞晨科技创始人。此前,尤洋公开表示,卖DeepSeek API(MaaS)每月亏本4亿元。该消息一度引起轰 动。目前,尤洋已回应称,"由于多人at我,我今天(3月1日)之内会直接地回复一下"。 理论上一天的成本利润率为545% 文章中,DeepSeek首次披露成本利润率关键信息。DeepSeek统计了在24小时统计时段内DeepSeek-V3和R1网页、App和API的所有负载,所有tokens按照DeepSeek- R1的定价,并假定GPU租赁成本为2美元/小时,总成本为87072美元一天。DeepSeek称理论上一天的成本利润率为545%。 其中,DeepSeek称,在最近的24小时里(北京时间2025 ...
DeepSeek宣布:活动正式收官
21世纪经济报道· 2025-02-28 08:46
2月2 8日,国内AI明星企业深度求索(De e pSe e k)为期五天的"开源周"活动正式收官。 "开源周"都发布了什么? 自2月2 4日启动以来,De e pSe e k "开源周"发布的五个项目涵盖了从计算、通信到存储的各个 方面。 2 月 2 4 日 : 首 个 开 源 的 代 码 库 为 F l a s h M L A , 这 是 针 对 H o p p e r G P U 优 化 的 高 效 M L A 解码内核,针对可变长度序列作了优化,目前已投入生产。 2 月 2 5 日 : 宣 布 将 D e e pEP 向 公 众 开 放 。 D e e pEP 是 用 于 M oE ( 混 合 专 家 ) 模 型 训 练 和 推 理 的 EP ( Ex p e rt P a r a l l e l ism , 专 家 并 行 ) 通 信 库 , 可 以 实 现 高 效 且 优 化 的 全 对 全 通信,支持包括F P 8在内的低精度运算,适配现代高性能计算需求。 2月2 6日:宣布开源D e e p G E M M。D e e p G E M M 是一个专为简洁高效的 F P 8 通用矩阵 乘 法 ( ...
刚刚!DeepSeek,硬核发布!
券商中国· 2025-02-27 03:35
DeepSeek又有大动作! 开源周第三天,DeepSeek宣布开源Optimized Parallelism Strategies(优化并行策略)。 Optimized Parallelism Strategies,该策略是为了提高计算效率、减少资源浪费并最大化系统性能而设计的并 行计算方案。这些策略通过合理分配任务、协调资源利用和减少通信开销,实现在多核、分布式或异构系统中 的高效并行执行。 英伟达通过在Blackwell架构上应用TensorRT DeepSeek优化,让具有FP4生产级精度的模型,在MMLU通用智 能基准测试中达到了FP8 模型性能的99.8%。目前,英伟达基于FP4优化的DeepSeek-R1检查点已经在Hugging Face上开源,并且可以通过以下链接访问模型地址:DeepSeek-R1-FP4。 在后训练量化方面,该模型将Transformer模块内的线性算子的权重和激活量化到了FP4,适用于TensorRT- LLM推理。这一优化使每个参数的位数从8位减少到4位,从而让磁碟空间和GPU显存的需求减少了约1.6倍。 使用TensorRT-LLM部署量化后的FP4权重文件,能够为 ...
陆家嘴财经早餐2025年2月27日星期四
Wind万得· 2025-02-26 22:44
// 热点聚焦 // 1、 DeepSeek开源周第三日,宣布开放DeepGEMM代码库。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库。该库采用CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。 DeepSeek并宣布,推出错峰优惠活动,北京时间每日 00:30至08:30的夜间空闲时段,API调用价格大幅下调,DeepSeek-V3降至原价的50%,DeepSeek-R1更低至25%。 2、 中证金融官微不再披露融资融券数据,两融市场每日数据由中证数据公司官网披露,历史数据也同步迁移至相同板块下。根据中证数据官网显示,其 披露统计范围涵盖"融资融券余额情况、融资融券交易情况、证券公司开展业务情况以及担保品情况"四大类共计18项具体指标。 3、 中金公司、中国银河发布公告回应合并传闻,均称公司未得到任何来自政府部门、监管机构或公司股东有关合并的书面或口头信息。 周三下午,有市 场消息称,中金公司将与中国银河拟通过换股方式合并,预计将于未来几周内宣布。受此影响,中金公司、中国银河A股当日收盘双双涨停;此外,中国 银河港股上涨超17%, ...
【太平洋电子-每日观点&资讯】(2025-02-27)
远峰电子· 2025-02-26 13:03
行情速递 ①主板领涨,科森科技(+10.04%)/和而泰(+10.01%)/泰晶科技(+5.86%)/露笑科技 (+5.60%)/盈方微(+4.35%)/ ②科创板领涨,灿芯股份(+20.00%)/芯原股份(+13.24%)/长光华芯(+10.53%)/天岳先 进(+9.98%)/安路科技(+6.72%)/ ③活跃子行业,SW 数字芯片设计(+3.23%)/ SW 半导体材料(+1.41%)/ 国内新闻 ①香港万得通讯社,2月26日/小米官宣15Ultra手机配备6000mAh电池/支 持90W有线充、80W无线充/官方海报显示/该电池具有10%超高含硅量/号 称"最强小米金沙江电池"/日常应用续航DOU高达1.46天/1000次有效充电 循环/电池可用容量仍>90%/ ③香港万得通讯社,DeepSeek宣布开源DeepGEMM/DeepGEMM是一个专 为简洁高效的FP8通用矩阵乘法(GEMM)设计的库/该库采用CUDA编写/ 在安装过程中无需编译/通过使用轻量级的即时编译(JIT)模块在运行时编 译所有内核/ ④36氪,自动驾驶人工智能科技公司Nullmax与瑞萨电子在上海正式签署战 略合作协议/根据协议 ...