DeepSeek V3模型 - filings, earnings calls, financial reports, news

DeepSeek V3模型

Search documents

混沌学园· 2025-06-10 11:07

在这个 AI技术日新月异的时代，我们眼看着它不仅在改变生活，更在改变着商业规则。 AI可不只是那些冰冷的算法，它现在能像人一样思考、推理，甚至在某些方面的表现超越了普通人。这告诉我们，传统的技术和创新模式已经不够用了，企业要想增长、要保持竞争力，就需要换个思路。 AI正在重新定义我们理解和实践商业创新的方式。最近，混沌君旁听了混沌学园的创始人李善友教授的重磅全新课程《认知型创新：从 OpenAI到DeepSeek》。这门课从企业创新的角度，讲述了全球两大顶尖 AI公司——OpenAI和DeepSeek是如何一步步走到今天的，他们究竟走过了怎样的创新之路。这对于我们理解AI时代的技术创新和企业创新，提供了清晰且极具价值的路径。教授深挖了 OpenAI最初的愿景和它如何对抗巨头的思路，解密大语言模型是如何诞生的，尤其是 AI能力如何从简单积累到惊人"涌现" 。还解读了 DeepSeek如何在资源有限的情况下，走出一条"低成本高性能"的独特道路；更探讨了 AI时代下，企业应该怎样构建一个能不断"涌现"创新的组织模式，走向"技术领先"。扫描下图二维码购买月卡 ...

小红书开源1420亿参数大模型，部分性能与阿里Qwen3模型相当

Tai Mei Ti A P P· 2025-06-10 01:07

在 AI 领域向来低调的社交平台小红书，近期开源了其首个自研大模型。 6月9日消息，小红书hi lab（Humane Intelligence Lab，人文智能实验室）团队近期在Github、Hugging Face等平台发布首款开源文本大模型dots.llm1。 | 1906 T. LETTORINGICE COUPALISON OF TRUSTOLUMEI ENRING THE THE OLL OUT THE LOOD TIGHT A | | --- | | n, n, and k represent the number of groups (experts) and the dimensions of each sub-GEMM problem, | | espectively. | 目前来看，dots.llm1大部分性能与阿里Qwen 2.5模型，部分性能与阿里Qwen 3模型相当。具体来说，dots.llm1混合专家模型（MoE）模型拥有1420亿参数，使用11.2万亿token的非合成高质量训练数据，在推理过程中仅激活140亿参数，能保持高性能的同时大幅度降低训练和推理成本。此次小红书团队 ...

Artificial Intelligence

Artificial Intelligence

news flash· 2025-05-15 23:16

美联储主席鲍威尔：将重新评估2020版货币政策框架的"关键部分"，长期利率可能走高，"供应冲击"或成新常态。美国4月PPI同比上涨2.4%低于预期，环比-0.5%，降幅创下五年来最大。美国4月零售销售环比 0.1%小幅超预期，消费者支出疲软显露端倪。特朗普同阿联酋签2000亿美元商业协议，合作在阿联酋建5GW数据中心。卡塔尔的特朗普"礼包"进一步揭开：主权财富基金拟十年在美投资5000亿美元。伊朗称愿与美国达成协议。伊朗最高领袖顾问：伊朗愿承诺永不制造核武，换取美解除制裁。哈马斯官员：若实现永久停火，可交出加沙地带控制权。阿里Q4营收同比增7%不及预期，阿里云增长加速18%，AI收入连续七个季度三位数增长。梁文锋参与发表回顾性论文：DeepSeek首次揭秘V3模型背后扩展方案。 Meta将推迟发布旗舰AI模型Behemoth，股价盘中跌超3%。 CoreWeave获英伟达持股7%，向OpenAI供40亿美元云计算产能。伯克希尔Q1大砍银行股，清仓花旗，苹果持仓未变，啤酒制造商持仓翻倍，存在保密持仓。沃尔玛Q1销售额增长2.5%略低于预期，CFO警告关税价格上涨可能从本月开始。 ...

Sou Hu Cai Jing· 2025-05-09 06:41

文︱陆弃 5月5日，《纽约时报》刊发了一篇耐人寻味的评论文章，作者不是别人，正是前谷歌首席执行官埃里克 ·施密特。这位曾长期代表硅谷秩序的人物，罕见地放下了美国科技优越感的傲慢，承认中国已经在人工智能等前沿技术领域从"追赶者"转变为"并跑者"甚至"领跑者"，直言"中国远远落后于美国的时代已然终结"。如果说十年前这样的判断还会被视为"危言耸听"，那么今天，这已成为西方智识阶层中最不愿承认、却不得不正视的现实。文章从DeepSeek、Temu、TikTok讲起，到人形机器人、电动汽车、工业制造，逐项列举了中国科技近年来取得的突破。施密特指出，尽管美国对中国实施了严厉的芯片出口管制和技术打压，但这些压力并没有使中国"退步"，反而加速了其自主研发、产业迭代和人才体系的强化。"制裁的副作用"，反而塑造了更坚韧、更务实的技术生态。正如文章中那句讽刺性极强的笑话所说："美国也应该制裁一下我们的男足，这样他们就能踢得好点。" 在某种程度上，这是对"脱钩战略"的当头棒喝。美国想通过技术封锁遏制中国，但最后却惊讶地发现，中国在芯片、AI大模型、机器人等领域的产业链不仅没有断裂，反而因压力而爆发出惊人的创造力。 ...

野村东方国际证券· 2025-04-03 08:37

- ■■- 核心摘要 2022年12月ChatGPT发布，引发全球市场对于AI发展的关注。伴随美国头部云厂商不断提升资本开支，AI基建领域产生众多投资机会。涉及产品包括变压器、UPS（不间断电源）、服务器电源、液冷；甚至由于AIDC（AI数据中心）建设的火爆，导致电网接入点稀缺，核电成为AIDC的优质电源，包括核电公司以及可控核聚变公司均受到关注。我们复盘ChatGPT发布后，海外AIDC基建类产业链股价走势，可以发现各区间段收益率靠前的细分赛道，基本对应当时AI产业演进中的核心矛盾或进展。从规律来看，大致可以分为四个阶段：1） ChatGPT出现带来算力需求高增，期间服务器电源关注度攀升；2）算力高增推动芯片技术迭代，相应导致功耗提升，服务器电源、液冷需求提升；3）AIDC进入实际建设阶段，AI基建（备用电源、变压器需求增加）；4）AIDC建设导致电网接入点难寻，燃气轮机、核电相应概念热度提升。综合以上分析，对于中国AIDC各细分产业链，我们观点如下：传统备用电源有望享受量价齐升红利。海外头部企业整体指引2025年营业利润率有望提升。我们认为主要原因有（1）需求量端，AI数据中心建设浪 ...

Artificial Intelligence

Artificial Intelligence