Workflow
DeepSeek
icon
Search documents
阿里预计未来资本开支超过去十年总和;瑞幸利润微增,迎接成本挑战;游戏和广告让B站连续两个季度盈利丨百亿美元公司动向
晚点LatePost· 2025-02-21 15:30
未来三年,阿里资本开支将超过过去十年总和。 今晚的阿里 2025 第三财季业绩会上,阿里集团 CEO 吴泳铭表示,AI 是几十年一遇的机会。阿里 的 AI 战略第一目标是 AGI (通用人工智能)的实现,可能远远超过现在可见的任何一个应用场 景。 他说,从实现 AGI 的商业价值来看,标准定义是能够完成 80% 以上的人类能力。全球 GDP 的 50% 支出是劳动工资支出,包括脑力劳动和体力劳动。如果实现 AGI ,人工智能相关产业大概率 将会是全球最大的产业,有可能影响或者替代现在 50% 左右的 GDP 构成。 管理层判断,阿里是亚洲市场具备几个关键要素的重要 AI 玩家,有亚洲最大、全球第四的云服务 和先进的自研 AI 模型,在 to c 生态上有最多应用场景。未来三年,阿里在云和 AI 的基础设施投 入预计将超越过去十年的总和(约 3800 亿元),要猛攻 AI 基础大模型和原生应用,死守技术领 先地位,以及用 AI 彻底改造电商等老业务,挖出用户新价值。 受 AI 相关利好推动,年初至今阿里股价已上涨近 49%,今日财报发布后,阿里盘前涨超 10% 至 138.2 港元。 9.9 价格战下,瑞幸咖啡 ...
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
晚点LatePost· 2025-02-20 14:21
"从开源论文、开源代码出发,现在已经进化到开源思维链了嘛!" 文丨Andrew Lu 注释丨贺乾明 程曼祺 2 月 18 日,Kimi 和 DeepSeek 同一天发布新进展,分别是 MoBA 和 NSA,二者都是对 "注意力机 制"(Attention Mechanism)的改进。 今天,MoBA 的一位主要研发同学 Andrew Lu 在知乎发帖,自述研发过程的三次踩坑,他称为 "三入思过 崖"。他在知乎的签名是"新晋 LLM 训练师"。 这条回答下的一个评论是:"从开源论文、开源代码出发,现在已经进化到开源思维链了嘛。" 注意力机制之所以重要,是因为它是当前大语言模型(LLM)的核心机制。回到 2017 年 6 月那篇开启 LLM 革命的 Transformer 八子论文,标题就是:Attention Is All You Need(注意力就是你所需要的一 切),该论文被引用次数至今已达 15.3 万。 注意力机制能让 AI 模型像人类一样,知道在处理信息时该 "重点关注" 什么、"忽略" 什么,抓住信息中最 关键的部分。 在大模型的训练阶段和使用(推理)阶段,注意力机制都会发挥作用。它的大致工作原理是 ...
宏观点评:民企座谈会释放积极信号-20250319
Minmetals Securities· 2025-02-19 23:30
Investment Rating - The report does not explicitly provide an investment rating for the industry or specific companies [4]. Core Insights - The recent meeting held by President Xi Jinping aimed to reassure private enterprises amidst external pressures, particularly in the context of "Trade Friction 2.0" and the intensifying global AI competition [2][6]. - The meeting emphasized the importance of private enterprises in technological advancement and social stability, signaling a commitment to dismantle barriers that hinder their development [6][12]. - Historical context shows that significant support policies for private enterprises have been issued during times of economic challenge, indicating a pattern of governmental support in response to external pressures [3][7]. Summary by Sections Event Description - On February 17, 2025, President Xi Jinping attended a meeting with private enterprises, marking a significant event after six years [1]. Event Commentary - The meeting's timing is crucial as it coincides with heightened external pressures and aims to provide a "calming pill" for private enterprises, which is different from past responses that came after crises [2][6]. - The focus on the "two unwavering principles" reinforces the government's support for private enterprises and aims to address historical issues such as financing difficulties [6][12]. Historical Review - The report outlines three major historical support policies for private enterprises, highlighting the government's adaptive strategies in response to economic conditions [3][7]. Industry Focus - The meeting included representatives from key sectors such as new energy vehicles, advanced manufacturing, and biotechnology, aligning with the goals of the "14th Five-Year Plan" [8][11]. - Notable absences from the meeting included major companies like Baidu and SenseTime, indicating a shift in industry leadership and focus [3][8]. New Productive Forces - The report discusses the importance of enhancing total factor productivity as a means to navigate external trade pressures and technological competition [12]. - The emergence of companies like DeepSeek is seen as a positive signal for the confidence of private enterprises in the face of global challenges [12].
GenAI 内存解决方案第 5 部分:DeepSeek 在芯片领域的高光时刻
Counterpoint Research· 2025-02-19 09:46
DeepSeek 的大语言模型(LLM)因其在性能上接近 ChatGPT ,但成本却大幅降低而受到关注。市 场的即时反应褒贬不一。虽然数据训练成本,比如数据标注和归类等方面的成本可能没有体现出 来,而这部分成本由政府支持,但 DeepSeek 在训练效率和低成本方面的优势依然十分明显。 DeepSeek 能否助力中国芯片制造? 中国的存储芯片或已具备成本竞争力 : 假设中国政府对构成总成本很大一部分的固定成本提供支持 ,那么与同行相比,中国已能实现有竞争力的成本。例如,2024 年第一季度 DRAM (动态随机存 取存储器)每 Gb ( 千兆字节 )的价格为 $0.34 ,此时高价的 HBM (高带宽存储器)对平均售价 的影响较小。而韩国 DRAM 的总成本大约为售价的 67% ,约为 $0.23 ,在不计固定成本的情况 下,中国的成本可能低至 $0.20 。(不过,中国的固定成本远高于韩国。) 高效的软件为低端硬件打开市场: 中国的策略是通过规模优势弥补与竞争对手在性能上的差距。华 为最新的 GPU —— Ascend 920 支持 HBM2 和 HBM2e ,而这些对于行业同行来说已是两年前的标 准,并未 ...
腾讯,刚捐5个亿
投资界· 2025-02-19 07:46
投向青年学生。 作者 I 杨继云 报道 I 投资界PEdaily 这是一则颇为低调的官宣。 昨日(2月1 8日),国家自然科学基金委员会宣布,已与腾讯公司正式签约,腾讯公司向 国家自然科学基金委员会无偿捐赠人民币5亿元—— 用于资助青年学生基础研究项目(博士研究生项目),重点支持其中女性、西部、粤港澳 大湾区获资助者开展基础研究。 中国科技界苦基础研究久矣。两个关键词——青年学生,基础研究,此次捐赠某种程度也 被视为风向标。 腾讯出5亿 做了一笔意外「投资」 这一次,腾讯将资金投向基础研究。 众所周知,基础研究并非易事,没有现成的方法和模式可以照搬,研究过程充满不确定性 和层层挑战。在全球范围内,众多的研究人员和团队都在从事基础研究,竞争异常激烈, 很难脱颖而出。而每一个研究项目立项背后,都需要大量资金的支持。 成立于20世纪80年代的国家自然科学基金,则是中国基础研究最主要的资助渠道之一, 形成了由研究项目、人才项目和环境条件项目三大系列组成的资助格局。 2 0 2 4年4月,首批国家自然科学基金青年学生基础研究项目(博士研究生)获批名单出 炉,包括北京大学、清华大学、西安交通大学、北京航空航天大学、华中科 ...
30天,DeepSeek改变了谁
投资界· 2025-02-19 07:46
以下文章来源于财经杂志 ,作者《财经》杂志 财经杂志 . 《财经》杂志官方微信。《财经》杂志由中国证券市场研究中心主办,1998年创刊,秉承"独立、独家、独到"的新闻理念,以权威性、公正性、专业性报 道见长,是政经学界决策者、研究者、管理者的必读刊物。 打破了几个"刻板共识"。 作者 | 《财经》杂志 来源 | 财经杂志 (ID: i-caijing) 2025年春节的前一周,节日气氛正浓,来自中国杭州的一家初创公司开始让华尔街投资人寝食难安。 杭州量化私募机构幻方旗下的大模型公司DeepSeek(深度求索)发布的一款开源AI模型,在多项测试中表现优于OpenAI的产品,且 研发成本不到600万美元。更让华尔街投资人震惊的是,DeepSeek1月20日发布R1模型,上线六天后同时登顶苹果App Store和谷 歌Play Store全球下载榜首,上线18天内,累计下载量已突破1600万次。随后在2月1日突破3000万大关,成为史上最快达成这一 里程碑的应用。 华尔街的担忧在于,目前投入数十亿美元用于构建大型AI模型的做法可能会打水漂,更廉价的替代方案将让华尔街人工智能的泡沫破 裂。泡沫破裂带来的资本市场危机短 ...
微信接入DeepSeek灰度测试,带动产业链估值回升
Guosen International· 2025-02-19 05:03
Investment Rating - The report indicates a positive outlook for Tencent Holdings (700.HK) and Alibaba (9988.HK), suggesting potential valuation recovery for these internet giants [3][7]. Core Insights - The integration of DeepSeek R1 into WeChat is expected to enhance Tencent's competitive edge and profitability, potentially leading to an increase in its valuation [2][5]. - The collaboration is anticipated to trigger a wave of technological competition and cooperation within the industry, prompting other leading internet companies to accelerate partnerships with AI model providers or increase their own AI research and development investments [2][7]. - The demand for cloud computing resources is expected to rise alongside the growth of AI applications, benefiting Tencent Cloud and other cloud service providers [8]. Summary by Sections Overview of WeChat's Integration of DeepSeek R1 - On February 15, WeChat began a gray test of DeepSeek R1, allowing users to access the full version of the model for free, enhancing the AI capabilities of various Tencent products [1][5]. Long-term Business Impact - The optimization of WeChat's search experience is likely to attract more users, increasing user engagement and boosting core business revenues such as advertising [2][7]. - New revenue growth paths are expected to emerge from AI technology, including paid AI services and enterprise-level AI solutions [2][5]. Market Impact - The integration of DeepSeek R1 is projected to have significant effects on the Hong Kong capital market and various industries, presenting new opportunities and challenges for investors [3][7]. - Tencent's valuation has decreased by over 50% from its peak of 30x PE in the past five years, indicating a potential for valuation recovery [3]. Recommended Stocks - The report recommends focusing on Tencent Holdings (700.HK), Alibaba (9988.HK), and various companies in the cloud computing and software service sectors, including China Mobile (941.HK), China Unicom (762.HK), and Kingdee International (268.HK) [3][8].
更厉害的来了
猫笔刀· 2025-02-18 14:22
嘿,马斯克的grok 3模型今天发布了,一句话总结就是大成本训练出来的新一代ai模型里的天花板,各种性能指标都更强了。 这次的grok 3是20万块GPU同步训练了近百天的模型,训练计算量是之前grok2的10倍。从这一点能看出,当你没有数据蒸馏的捷径可走的时候,当你已经 走到行业最前端的时候,就很难避免需要重资产投入堆算卡,英伟达这样的公司依然是ai时代的核心受益者。 英伟达股价在遭遇deepseek冲击后一度下跌1/4,不过最近10连阳基本上把坑填上了。 说回grok3,它的表现究竟如何呢?我整理了一个测试表现数据: grok3是第一个得分突破1400的模型,这也是马斯克团队引以为傲的亮点。 | Rank* | Rank | Model | Arena | ▲ 95% CI | ▲ Votes | ▲ Organization | | --- | --- | --- | --- | --- | --- | --- | | (UB) | (StyleCtrl) | | Score | | | | | 1 | ਜ | chocolate (Early Grok-3) | 1402 | +7/-6 | 7829 ...
今天,马斯克火力全开
投资界· 2025-02-18 07:52
马斯克如约而至。 北京时间今天(2月1 8日)中午,马斯克现身发布会,旗下xAI正式发布Gr o k - 3大模型 ——用他的话来说,这是"地球上最聪明的人工智能",优于目前所有已发布的产品。 纵观发布会,除去马斯克的老对手Ope nAI,还有一个中国企业的身影频频出现—— De e pSe e k。尽管马斯克此前嘴上说着并不在意,但产品诸多参数却都处处对标 De e pSe e k。 显然,这又是一个他无法忽视的对手。 华人创始团队现身 "地表最强"。 作者 I 刘博 报道 I 投资界PEdaily 马斯克说,地球最强大模型来了 而在训练Gr o k的过程中,团队则搭建了大型算力集群,并克服了散热、电力等问题带来 的挑战,用了1 2 2天让首批1 0万张GPU投入使用并正常运行,现在他们计划将集群规模继 续扩大一倍。 随后团队还现场展示,要求Gr ok- 3现场生成一段太空发射的3D动画的代码,并运行了这 段代码,直播画面上显示出了飞船在地球和火星间往返的动画。随即,团队又用Go r k - 3 演示制作了一款类似于俄罗斯方块的游戏。同时,马斯克也在直播中宣布,将在 xAI 推 出一个人工智能游戏工作室。 ...
杭州DeepSeek,让其他城市沉默
叫小宋 别叫总· 2025-02-18 03:35
DeepSeek 的热度从春节期间开始持续,复工后,各地方政府纷纷组织专项讨论。 (一) 某新一线城市,在过去几年招引了多家芯片设计企业,多数企业都讲的是 AI 的故事。做 GPU 的,做 ASIC 的,做训练的,做推理的,等等等等。 春节期间 DeepSeek 突然爆红的时候,招商局局长乐坏了,心想,这下 AI 行业可稳了。 AI 稳了,算力 芯片应该也就稳了。 我算没白辛苦,过去几年费了那么多劲,撒了那么多母基金的钱,招引了这么多企业。 节后第一天,局长拉下属 开会,讨论如何借着 DeepSeek 的这股风,让当地企业有更好发展,让当地的 招商引资工作有更好的发展。 然后,招商经理小宋耿直发言:领导, DeepSeek 模型特别轻,大幅降低了对算力芯片的依赖。我觉得 DeepSeek 对我市企业,对我市的招商引资工作反而带来巨大挑战。 另外,领导,传言DeepSeek自己也在开发AI芯片。 说完,领导沉默了 ... (二) 北方某城市,当地有一家AI大模型的应用层的企业,春节期间 DeepSeek横空出世,科技局局长就一直 心心念,希望推动政府各部门接入这家企业的产品。 局长大喜,说希望尽快去这家企业拜访 ...