Seek .(SKLTY)

Search documents
DeepSeek席卷车圈 AI如何改变你的用车生活
中国经济网· 2025-03-04 09:03
中国消费者报报道(记者吴博峰)近期,凭借着算法的优化和更高效的处理能力,DeepSeek大模型横 空出世,迅速风靡市场。这一"旋风"也席卷了汽车行业,比亚迪、上汽、吉利等国内主流车企纷纷官宣 接入DeepSeek。业内认为,接入AI大模型将推动汽车智能化加速落地,实现座舱智能化、个性化的进 一步升级。DeepSeek将从哪些层面为用户带来更便捷的智能出行体验?《中国消费者报》记者进行了 调查。 车企争相接入AI大模型 近年来,随着"新四化"技术发展步伐加快,人工智能技术正在深刻改变着全球汽车行业的竞争格局。智 慧座舱、车机系统、辅助驾驶功能等智能化功能已广泛搭载于量产新车之上,很大程度上改变了人们的 用车生活。 在此背景下,如何在短期内更好地满足消费者用车需求,成为摆在车企面前的一道待解难题。而 DeepSeek的到来让业内看到了破解难题的希望。 据了解,由于DeepSeek能为汽车智能化转型提供核心驱动力。从用户体验优化到自动驾驶技术升级, 从行业成本重构到全球市场格局调整,其影响已渗透至汽车产业的方方面面。 2月6日,吉利率先宣布其自主研发的星睿大模型已与DeepSeek-R1完成技术融合,主要对星睿车控 ...
DeepSeek对算力影响解读
2025-03-04 07:01
DeepSeek 对算力影响解读 摘要 • DeepSeek 通过模型并行、Deep EP 技术和 new pipe 技术,显著提升 机器推理吞吐量(至少 5 倍)并降低延时(30%-50%),其中 new pipe 技术比标准 NCCL 通讯库效率高 20%-40%,延时减少 15%-30%。 • DeepSeek 在全球节点资源调度方面表现出色,通过昼夜切换提高资源利 用率 40%,降低综合成本 35%。其 KD cache 缓存机制命中率高达 56.3%,有效减少计算需求,提高推理效率。 • DeepSeek 采用 256 个专家的多专家架构,计算性能效率比其他厂商每层 16 个专家集合四个的做法高 8 到 10 倍,在同等算力下,计算性能明显优 于普通模型。 • DPC 声称用不到 2000 张卡支撑 2,400 万日活用户,但实际回答率仅为 20%,表明算力负载不足以完整响应用户请求,且 B 端和 C 端混合统计影 响了实际负载评估,该数据需要进一步澄清。 • 行业内毛利率通常在 40%-80%之间,DPC 公布的 85%毛利率过于乐观, 未充分考虑 H800 租金等成本。行业标准毛利率应为 60% ...
中金:大模型系列(1):DeepSeek-R1量化策略实测
中金· 2025-03-04 07:00
Investment Rating - The report does not explicitly provide an investment rating for the industry or specific companies Core Insights - The rapid evolution of large language models (LLMs) like DeepSeek-R1 has garnered significant attention from investors, particularly in their application to quantitative strategies in industry rotation, style rotation, and market timing tasks [1][2] - DeepSeek-R1 has demonstrated stable excess returns in industry rotation tasks, outperforming the equal-weighted industry return by 22.3% since 2024 [4] - The report emphasizes the unique advantages of LLMs in industry allocation tasks compared to stock selection and market timing, as industry performance is more influenced by macro policies and industry conditions [4] Summary by Sections Large Language Models and Alternative Data - LLMs are built on deep learning techniques and can process vast amounts of unstructured text data, making them suitable for extracting investment signals from alternative data sources [11][12] - The growth of alternative data is significant, with projections indicating that global data volume will reach 175ZB by 2025, highlighting the potential for LLMs to analyze non-traditional data types [13] Applications of LLMs in Investment - LLMs can assist quantitative analysts in efficiently constructing code, significantly reducing the development cycle from strategy logic to implementation [2][29] - They can also help analysts quickly find and summarize recent research, forming expert knowledge bases for specific inquiries [2][29] - The integration of LLMs with alternative data sources, such as news and research reports, enhances their effectiveness in strategy development [2][29] Performance of DeepSeek-R1 - The 671 billion parameter version of DeepSeek-R1 has shown superior performance in various tasks, particularly in industry rotation, with a stable excess return of 22.3% since 2024 [4] - The model's performance in size rotation strategies has a win rate of 54.33%, yielding an excess return of over 12% [4] - Market timing strategies have also yielded an excess return of approximately 18% since 2024, although with slightly less stability [4] Limitations of LLMs - Despite their rapid development, LLMs face limitations such as knowledge hallucination, randomness, memory constraints, and data leakage, which can impact the reliability of quantitative strategies [5] - The report highlights the need for caution regarding the accuracy of outputs generated by LLMs, particularly in high-stakes investment contexts [5][43] Future Trends - The report discusses the ongoing evolution of LLMs, emphasizing the importance of cross-modal capabilities and the integration of various data types to enhance their application in investment strategies [26][27]
点赞DeepSeek,谈中美经贸关系 、民营经济等 ,这场发布会信息量很大!
证券时报网· 2025-03-04 06:42
十四届全国人大三次会议于3月4日12时举行新闻发布会,大会发言人娄勤俭就大会议程和人大工作相关 问题回答中外记者提问。发布会要点速看→ 娄勤俭介绍,十四届全国人大三次会议将于3月5日上午开幕,3月11日下午闭幕,会期7天,共安排3次 全体会议。 娄勤俭介绍,会议期间,将举行三场记者会,请国务院有关部门主要负责同志分别就外交、经济、民生 等主题回答记者的提问。每次全体会议前,将安排"代表通道"介绍履职情况,反映代表心声。全体会议 后将安排"部长通道",解读政策措施,回应社会关切。 娄勤俭说,当前,中国经济运行仍面临不少困难和挑战。但中国经济基础稳、优势多、韧性强、潜能 大,长期向好的支撑条件和基本趋势没有变。中国经济从来都是在风雨洗礼中成长、在历经考验中壮 大。"我们对中国经济的前景充满信心。" 娄勤俭说,国防预算是中国国家总体预算的一部分。中国国防费从2016年起连续9年保持个位数增长, 国防费占国内生产总值的比重多年维持在1.5%以内,低于世界平均水平。 娄勤俭说,人大对外交往是国家总体外交和人大工作重要组成部分。目前,全国人大与190个国家的议 会保持着联系交往,建有26个对外交流机制、143个对外双边友 ...
Kingsoft Office (.SS)_ DeepSeek-R1 model available on WPS AI; 4Q24 NI beat at 43% YoY; Buy
2025-03-03 10:45
28 February 2025 | 2:13AM HKT Kingsoft Office (688111.SS): DeepSeek-R1 model available on WPS AI; 4Q24 NI beat at 43% YoY; Buy Kingsoft Office (KO) reported 4Q24 preliminary results (link) with revenues growth at 16% YoY in 4Q24, improving from 3Q24 +11% YoY, while 6% lower than our estimates, due to muted enterprise spending and limited revenues contribution from WPS AI. 4Q24 net income was better than expected at Rmb605m, or 9%/ 53% beats vs. our/ Bloomberg consensus estimates, and we attribute this to im ...
全面适配!京东云将DeepSeek推理场景性能提升50%
中国经济网· 2025-03-03 09:10
通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走 RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的 性能串。 更低成本更高效率,让大模型真正用起来针对客户大模型的使用需求,京东云vGPU AI算力平台,为用 户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。 京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用 相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景 下保证了推理的吞吐量和延迟表现。 此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布 式推理,显著提高推理吞吐。 在DeepSeek为期五天的"开源周"中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、 DualPipe & EPLB、3FS文件系统),惊艳全球。 京东云率先宣布完成对这五项 ...
运营商DeepSeek加速服务政企-看好云-AI价值重估
2025-03-03 03:15
运营商 DeepSeek 加速服务政企,看好云+AI 价值重估 摘要 Q&A 近期算力板块的市场表现如何?有哪些因素影响了其走势? 上周四和周五,算力板块出现明显下跌。主要原因包括海外英伟达业绩未达到 预期,以及 GPT-4.5 在高成本下未能实现显著效率提升。这些因素导致投资者 对海外算力板块产生顾虑,进而影响到国内算力市场。 • 云计算行业规模效应显著,对标北美 AWS,国内云计算厂商盈利潜力巨大, 尤其软件部分占比高且规模达一定体量时。DeepSeek 通过合理配置算力资 源,实现高效益,为算力过剩厂商提供借鉴。 • 去年三大运营商大量 AI 算力投资(主要偏向 910B)利用率不高,今年 DeepSeek 技术突破提升了 90B 利用率。运营商或将 920B 以 DPC 一体机模 式出售,毛利率可达 15%以上,或通过第三方企业调用算力使用 DeepTag 消纳冗余资源。 • 运营商云计算盈利能力和收入增长潜力被市场低估。去年三大运营商云计 算业务平均增长 14%,今年预计政府和国有企业大规模接入将推动收入显 著增长,增速或提升至 20%-25%。 • 预计 2025 年中国电信营收可能达到 1,30 ...
电子掘金-DeepSeek如何影响推理需求
2025-03-03 03:15
DeepSeek V3 和 R1 延续了 V2 版本中使用的 MOE 多头自注意力机制,通过压缩 KV 存储来降低存储需求。具体操作方法是不对所有的 key 和 value 进行存储, 而是存储一个压缩后的低维变量 C,并将其投影到投影空间。在计算过程中恢 复出 key value 得出原始值,从而大幅降低了存储需求。这种方式将解码过程 中的访存密集型任务转换为计算密集型任务,实现了省存储且无多余训练开销 • DeepSeek V3 和 R1 通过压缩 Key Value 存储,将访存密集型任务转化为计 算密集型任务,降低存储需求且无需额外训练开销。原生稀疏注意力机制 (NIC)优化硬件资源占用,与 MOE 架构形成互补,分别关注局部细节和全 局建模。 • DeepSeek V3 和 R1 在硬件工程化上分离预填充(pre-fill)与解码 (decode)阶段,并采用冗余专家及动态冗余策略优化硬件使用,提高推 理效率和准确性,平衡 GPU 负载。 • DeepSeek V3 和 R1 采用大规模跨节点专家并行方法,降低对单一节点硬件 要求,提高整体吞吐量并降低延时,但增加了网络通信及显存带宽压力, 需要大量 ...
DeepSeek开源周-划重点
2025-03-03 03:15
DeepSeek 开源周:划重点? 摘要 Q&A DeepSeek 开源周的主要内容和目的是什么? DeepSeek 开源周的主要目的是分享从 V2 到 V3 以及 R1 版本中使用的核心模块 和基础设施层面的优化代码。此次开源涵盖了多个方面,包括硬件优化、推理 成本降低、算力提升等。具体来说,第一天开源了 FlashMLA 算法,该算法通过 压缩长文本中的 KV 开始来降低推理成本;第二天涉及专家并行(EP),优化了 不同 GPU 之间的通信和计算负载均衡;第三天则是矩阵乘法运算算子,支持 FP8 精度;第四天重点在于管线并行和专家负载均衡;第五天则是文件管理系 • DeepSeek 开源 FlashMLA 算法,通过压缩长文本 KV 缓存降低推理成本,解 码内核代码基于 Hopper 架构 GPU,摩尔线程已进行国产化迁移,旨在提升 训练效率。 • 专家并行(EP)技术通过将专家分布在不同 GPU 上,利用门控机制和凹凸 凹(auto 2)机制优化通信,支持 FP8 低精度运算,提升大规模模型计算 效率,V3 版本 DMC 分配 256 个专家。 • 管线并行优化将模型层级计算分配到不同 GPU,实现计算 ...
【早知道】小米SU7 Ultra锁单量突破10000台;DeepSeek首次披露:理论成本利润率545%
证券时报网· 2025-03-02 23:42
DeepSeek首次披露:理论成本利润率545%。 特斯拉CEO马斯克:特斯拉未来五年利润增长1000%是可能发生的。 小米SU7 Ultra锁单量已突破10000台,提前完成全年任务。 英国借乌克兰20多亿英镑,泽连斯基要用"俄罗斯的钱"还债。 人民财讯3月3日电,摘要:十四届全国人大三次会议将于3月4日12时举行新闻发布会。 央行等五部门:支持民营企业通过资本市场发展壮大。 2月份制造业采购经理指数(PMI)为50.2%,比上月上升1.1个百分点。 ...