Seek .(SKLTY)
Search documents
中金-科技硬件:AI进化论(1):DeepSeek推动“大模型平权”,是训练算力的拐点还是黑洞?
中金· 2025-02-27 02:58
Investment Rating - The report rates the industry as "Outperform" with specific stock recommendations for Nvidia and Broadcom, indicating a positive outlook for AI hardware and infrastructure demand [4][7]. Core Insights - The report highlights the significant advancements made by DeepSeek in generative AI technology, particularly its V3 model, which achieves capabilities comparable to leading models like GPT-4 at only 1/10th the training cost. This innovation is seen as a response to the constraints on AI hardware procurement due to US-China trade tensions, suggesting a potential increase in demand for computational resources across the industry [4][5]. Summary by Sections Model Innovations - DeepSeek continues to utilize the MoE (Mixture of Experts) architecture, which reduces computational costs by activating only a subset of expert models during training. The V3 model has increased the number of experts to 256, optimizing resource usage [10][11]. - The introduction of FP8 precision training significantly lowers computational resource consumption compared to traditional FP16 methods, enhancing training efficiency [18][19]. - The MTP (Multi-token Prediction) method improves training efficiency by allowing the model to predict multiple tokens simultaneously, thus increasing data utilization and reducing overall training data requirements [24][28]. Hardware Engineering Innovations - The report discusses the importance of hardware engineering innovations in response to the growing demands of large models. The use of distributed parallel strategies, such as Expert Parallel (EP), allows for efficient deployment of expert models across multiple GPUs, minimizing communication overhead [35][38]. - The DualPipe strategy enhances the efficiency of data transmission during training by allowing simultaneous forward and backward computations, thereby reducing idle time for computing devices [44][47]. - The implementation of PTX code facilitates hardware optimization, enabling developers to maximize the efficiency of specific models under given hardware conditions [49][51]. Market Demand and Trends - The report anticipates robust growth in the AI hardware and infrastructure market driven by the "democratization of large models," suggesting that the demand for efficient computational resources will continue to rise [7][8]. - It emphasizes the need for customized chip architectures to support the evolving requirements of MoE models, indicating a shift in design priorities within the semiconductor industry [53].
中金-从规模经济看DeepSeek对创新发展的启示
中金· 2025-02-27 02:58
宏观视点 2025年2月27日 从规模经济看 DeepSeek 对创新发展的启示 DeepSeek的出现有几个没想到,不是大型科技企业和科研院所而是初创企业,不是 实体科技公司而是一家金融领域的公司,不是来自处于领先地位的美国而是在大模 型领域相对落后的中国。这一切纯属偶然吗?只有大机构才能研发AI大模型的背后 是所谓的规模定律,即要素(数据、算力)投入的边际产出下降,模型性能提升需 要不断增加要素投入,带来规模的门槛要求。DeepSeek的破解在于以算法优化(技 术进步)提升算力(要素)的边际产出,一定程度上替代了算力投入。技术进步从 个体来讲似乎有偶然因素,但从宏观来讲是规模经济效应的力量,尤其是外部规模 经济,即上下游协同、共享基础设施和人才池的创新生态,中国在数字基础设施和 人才规模优势方面尤其突出。规模经济效应意味着大模型未来的发展或仍将由大国 主导。就中美之间的互动而言,规模定律隐含后发者有优势,所以美国通过限制算 力出口减缓中国的追赶。这是因为落后者要素投入的边际产出高于领先者,市场机 制激励要素投入从领先者流向落后者,有利于两者差距的缩小,这有点类似经济学 新古典增长模型的逻辑,即规模报酬递减 ...
云南省“融信服”平台正式接入DeepSeek
Zheng Quan Shi Bao Wang· 2025-02-26 23:57
证券时报网讯,据云南省数据局消息,近日,云南省融资信用服务平台(简称:省"融信服"平台)完成 了DeepSeek人工智能大模型的接入调测工作,正式开放服务,标志着省融信服平台在利用AI技术开展 智能金融服务上迈出了重要一步。 ...
对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示
Zhong Guo Jing Ji Wang· 2025-02-26 23:41
Core Insights - The emergence of DeepSeek AI has significantly impacted the AI industry, leading to rapid innovation and application across various sectors, with expectations of a breakthrough in AI penetration within 18 months [2][4][29] - The company, Zhongke Wenge, has successfully developed its own AI models, including the Yayi model, which has contributed to substantial revenue growth, with over half of its income directly linked to this model [3][5][25] - The shift in investment attitudes towards AI startups has transitioned from a focus on technology to practical applications, highlighting the growing importance of AI in the market [4][5] Group 1 - DeepSeek AI has reached the top of the iOS free app charts in both China and the US, showcasing its rapid adoption and influence in the global AI landscape [2] - The integration of DeepSeek into Zhongke Wenge's X-Agent platform allows clients to quickly develop industry-specific AI applications, reducing technical barriers and development time [2][14] - The company has expanded its business into various sectors, including finance, healthcare, and energy, demonstrating its versatility and adaptability in the AI market [3][21] Group 2 - The training cost for DeepSeek's models is significantly lower than that of competitors, with estimates suggesting costs are 1/10 to 1/20 of ChatGPT's, which encourages broader participation in AI development [6][10] - The company emphasizes the importance of both open-source and closed-source models, advocating for a balanced approach to innovation and intellectual property protection [7][10] - The AI industry is expected to experience explosive growth by 2025, driven by advancements in technology and increased market demand for AI applications [29][30] Group 3 - Zhongke Wenge's decision to develop the Yayi model was a pivotal moment, aligning with the broader AI transformation initiated by the launch of ChatGPT [24][25] - The company has achieved a near 100% renewal rate with key clients, indicating strong customer loyalty and satisfaction [17] - The integration of AI into decision-making processes is highlighted as a critical area for future development, with a focus on dynamic and real-time data analysis [28]
“智变”提速 DeepSeek金融“朋友圈”持续扩容
Zhong Guo Jing Ji Wang· 2025-02-26 23:34
保险机构亦在加速行动。新华保险、人保财险、太平人寿等多家保险机构纷纷宣布接入DeepSeek模 型,从赋能角度而言,提升效率、优化服务等是行业布局的主要逻辑。"之所以接入DeepSeek,主要在 于公司对大模型技术在推动业务数字化转型中的巨大潜力有着前瞻性的判断。"太平人寿有关负责人接 受记者采访时表示,当前,太平人寿已在多个业务领域开展大模型应用探索,包括研发代码助手、运 营"添翼系统"知识引擎以及太平人寿AI助手。 金融科技领域,金融壹账通宣布推出了自主研发的智能体平台,并接入DeepSeek、通义千问等开源大 模型,推出面向银行业的全场景AI解决方案。 "乐信是国内最早部署和应用DeepSeek的金融平台之一。"乐信CTO陆勇告诉记者,乐信在DeepSeek基础 之上,通过乐信金融专属数据预训练、业务数据精调,打造专属于乐信的金融垂直Al大模型"奇点",并 加速在公司业务多个领域落地应用。研发提效方面,公司大模型已实现研发人员100%落地应用,全年 提出质量改进建议21万次,有效助力研发人员编码效率提升约35%。 伴随开源AI大模型DeepSeek展现出广阔的应用场景,从银行、保险、证券到金融科技公司纷 ...
DeepSeek带火算力市场
Zheng Quan Shi Bao Wang· 2025-02-26 23:27
多位业内人士表示,DeepSeek显著降低了全社会数智化的门槛和成本,基于各种应用场景的需求会出 现爆发式增长,这种端侧AI增长又反向促进云侧AI发展,进而形成云、端AI算力均快速增长的态势。 证券时报网讯,算力卡需求增加,此前被冷落的H20芯片成为香饽饽;客户尝试大模型服务的意愿增 强,智算中心空置率正在下降;算力租赁价格开始上涨,运营商大力推广搭载华为昇腾芯片的 DeepSeek大模型一体机…… 随着DeepSeek大模型被广泛适配和接入,算力硬件及租赁市场迎来翻转, 需求增长快速显现。 ...
"智变"提速 DeepSeek金融"朋友圈"持续扩容
Zhong Guo Jing Ji Wang· 2025-02-26 23:26
金融科技领域,金融壹账通宣布推出了自主研发的智能体平台,并接入DeepSeek、通义千问等开源大 模型,推出面向银行业的全场景AI解决方案。 "乐信是国内最早部署和应用DeepSeek的金融平台之一。"乐信CTO陆勇告诉记者,乐信在DeepSeek基础 之上,通过乐信金融专属数据预训练、业务数据精调,打造专属于乐信的金融垂直Al大模型"奇点",并 加速在公司业务多个领域落地应用。研发提效方面,公司大模型已实现研发人员100%落地应用,全年 提出质量改进建议21万次,有效助力研发人员编码效率提升约35%。 此外,汇添富基金、诺安基金、万家基金等十余家公募基金公司已部署DeepSeek大模型,力推向科技 驱动型基金公司转型。 作为开源AI大模型,DeepSeek无疑将为金融业带来新的可能性。上海金融与发展实验室主任曾刚对记 者表示,大语言模型等在金融领域的应用已从辅助工具阶段迈向核心生产力阶段,从"试验阶段"进 入"深度融合阶段"。它不仅为金融业提供了可复用的技术框架,更预示着金融行业将朝着智能化、个性 化和高效化的方向发展。 伴随开源AI大模型DeepSeek展现出广阔的应用场景,从银行、保险、证券到金融科技公 ...
DeepSeek、阿里强势开源 逼出闭源大模型的“危机感”
Zheng Quan Shi Bao Wang· 2025-02-26 23:26
在当前的主流模型中,OpenAI最初走开源路线,但后来转向闭源,GPT-3和GPT-4的模型细节和训练数 据并未公开;Meta则始终坚持开源路线,其LLaMA(Large Language Model Meta AI)系列模型在开源 社区很受欢迎;Google则采取了混合策略,核心模型Gemini为闭源产品,但也同时开源了Gemma等小 型模型。 在国内市场情况也类似,百度、月之暗面等采取闭源策略,阿里、DeepSeek采取开源策略,智谱、百 川智能等与Google路径相似,把小参数模型开源,核心模型仍保持闭源。 2月25日,阿里云宣布了一个重磅消息:其视觉生成基座模型万相2.1(Wan)正式开源。 据悉,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的所有推理代码和权重全部开 源,同时支持文生视频和图生视频任务。 随着万相的开源,阿里云实现了全模态、全尺寸的开源。大厂的积极入局,大模型领域开源的声量似乎 占了上风。 一直以来,关于大模型开源与闭源的路径之争未有定论,开源有利于吸引用户和生态构建,闭源更侧重 于持续的商业化运营,头部几家大模型企业的路径各不相同。 然而,随着开源大模型 ...
工业AI检测新征程,中科迪宏TimesAI融合DeepSeek的落地实践
2025-02-26 16:51
到了一级市场创业公司识别检测领域的这个领军企业中科迪宏的CFO李总跟他做一个分享和交流那组织这个交流呢一方面也是考虑到投资者在出现前后对国内的这个DS带动的这个人工智能落地应用有了更多的关注在这么时段也掀起了比较积极的一个这个国家上的一个反馈那同时我们也看到除了在SARS公司层面的一个应用落地以外其实在一级市场的创业公司里面也非常多踏实的在做这种这个落地和结合和应用 然后中国地方在那个创业团队在安徽合肥然后有非常多的这个科大的这个团队的背景然后之前在包括那个3C半导体然后PCB等等一系列的领域有非常多的这个落地大力也有非常多上市公司的那个客户那这个整个保持了一个非常好的这个产品经营力和这个发展的一个增幅我们也是今天有幸的请到公司的这个创始人类职员李总给大家做一个分享交流也会让大家更好的 这个了解在意义市场这个实业的领域啊如何在跟AI结合做这个比较具象的落地去看到更多的一些投资机会和这个发展亮点啊也这个希望能够有更多的一些这种业务的这种契合或者说投资机会的一个挖掘那就不多耽误大家宝贵的时间啊谢谢李总就这个这个PPT啊跟大家做一个分享所以我们在节目当中谢谢李总好的好的嗯感谢感谢主持人感谢国金证券给我们这个机会跟大 ...
头豹研究院 DeepSeek对AI产业的影响
2025-02-26 16:51
hello大家好很高兴这个机会跟大家再见面我是投报研究院综合组的分析师陈庆龄欢迎收看本期投报代理图研报栏目今天我们一起来探讨一下近期最火的deep state然后探讨一下它对整个AI产业的一个影响 好我们这次录影大概会从四个方向去讲解这个DXA它对整个AI产业的影响第一个是它的第一训练的成本带来的影响第二个是它引发的全球开源地缘模型的一个大讨论 第三个呢是英伟达就是这个deep state对英伟达这个算力市场的一个冲击与重构然后最后呢就是讲一下这个deep state引发的这种摩森争流与知识产权的一个争议好开始了我们先讲这个deep state v3训练成本这个 背后引发了一些争议首先我们要先了解一下这个事情的大概的一个背景就是说deep state它引发的这个争议主要是集中在它这个低成本的一个训练模型上尤其是它这个V3模型的一个训练费用这个训练费用呢据他们自己的这个官方的一个发布呢就是说训练仅花了这个557.6万美元然后这个计算的一个规则呢他们是通过这个租赁278.8万个 H800的一个GPU的小时来计算的这种成本然后平均每小时的租金为两美元这个成本呢大概就是GV4的二十分之一然后这个低成本的一个低序列成本 ...