o1 模型 - filings, earnings calls, financial reports, news

o1 模型

Search documents

2025-07-02 15:49

硅谷模型大厂变化：对预训练和 Capex 的影响？ 20250702 摘要 Meta 积极挖角 OpenAI、谷歌和 Anthropic 等公司人才，尤其集中在多模态处理、后训练和推理模型领域，旨在提升 LLAMA 模型竞争力，加速下一代大模型研发。 Meta 通过收购 Skill AI 加强数据筛选能力，弥补参数量不足，同时加速集群建设，学习 OpenAI 模式，综合提升数据、人力和算力，推动下一代模型发展。 OpenAI 的 O1 模型核心团队成员流失，任宏宇、赵胜佳和余佳慧等关键人物被挖走，对 OpenAI 造成一定冲击，促使其加快发展步伐。 AI 人才薪酬大幅上涨，顶尖人才年薪高达一亿美元，显示科技公司对 AI 人才的争夺白热化，扎克伯格通过高薪全面压制竞争对手。 2025 年下半年，科技公司将回归预训练阶段，Meta、谷歌和 OpenAI 采取不同策略：Meta 侧重数据，谷歌优化架构，OpenAI 坚持大集群战略。 Q&A 近期硅谷的变化对全球大模型 AI 演绎节奏有何影响？近期硅谷的变化显著加快了全球大模型 AI 演绎的节奏。今年（2025 年）下半年，美国将进入新一轮的大模型迭 ...

Meta Platforms(US:META)

DeepSeek对英伟达长期股价的潜在影响

CHIEF SECURITIES· 2025-03-12 06:38

2025/02/11 中国宏观经济研究员杨曦 010-66555831 xi_yang@chiefgroup.com.hk DeepSeek 对英伟达长期股价的潜在影响 1 月 27 日，DeepSeek 在中国区和美国区的苹果 App Store 免费榜上同时登顶，成为下载量第一的应用程序。与此同时，美国科技股市场却遭遇了大幅下跌，费城半导体指数（SOX）下跌了 9.2%，创下自 2020 年 3 月以来的最大单日跌幅。其中，英伟达股价下跌了近 17%，市值蒸发了近 6000 亿美元，成为美股历史上最大规模的单日市值缩水之一。甚至 WTI 原油价格也在盘中一度下跌了 3%。一些交易员认为，如果大模型的训练和推理不再需要大量算力，数据中心的电力需求也会随之减少，进而减少对石油发电的依赖。这场科技股的大幅波动，主要归因于 DeepSeek 在训练和推理成本上的显著优势。 | 模型(1) | 上下文长度 | 最大思维链长度(2) | 最大输出长度(3) | 百万tokens | 百万tokens | 百万tokens | | --- | --- | --- | --- | --- | --- | --- ...

速递｜DeepSeek 声称其“理论”利润率为 545%

Z Potentials· 2025-03-02 02:37

图片来源： DeepSeek DeepSeek 最近公开其 AI 模型可能的盈利情况——但有一些附加条件。在 X 上的一篇帖子中， DeepSeek 称其在线服务的"成本利润率"为 545% 。该利润率是基于"理论收入"计算的。在一篇更长的 GitHub 帖子结尾详细讨论了这些数字，概述了其实现"更高吞吐量和更低延迟"的方法。DeepSeek 写道，当它查看其 V3 和 R1 模型在 24 小时内的使用情况时，如果所有使用都按 R1 定价计费， DeepSeek 每天的收入将达到 562,027 美元。与此同时，租赁所需的 GPU （图形处理单元）的成本仅为 87,072 美元。 DeepSeek 承认，由于多种原因，其实际收入 "显著低于"预期，例如夜间折扣、 V3 的较低定价，以及"只有一部分服务实现了商业化"，而网络和应用程序的访问仍然是免费的。当然，如果应用程序和网站不是免费的，并且没有其他折扣，使用量可能会显著降低。因此这更像是对未来潜在利润率的一个预估，而不是 DeepSeek 当前现实情况。 DeepSeek 在关于人工智能成本和潜在盈利能力的更广泛讨论中分享这些数字。 Deep ...

DeepSeek 刷新全球 AI 格局；50 美元模型蒸馏术；美国公司们宣布 8000 亿美元算力投资丨AI 月报

晚点LatePost· 2025-02-10 09:50

DeepSeek 在 1 月 20 日上线 R1 模型后，凭借高性能（比肩 OpenAI o1）、低使用成本（API 价格是 o1 的 1/30）、开源模型权重等，迅速接管 OpenAI 等公司主导的大模型叙事。 DeepSeek 怎么刷新全球大模型格局李飞飞在内的团队如何低成本 "蒸馏" 出特定领域追赶 o1 的模型到去年底，OpenAI 年化收入超 60 亿美元 OpenAI 的星门计划：投 5000 亿美元建算力 26 家获得超过 5000 万美元融资的 AI 公司，中国有 2 家大模型公司的爬虫遭 "下毒" 抵抗这之前，因为 OpenAI 展示能力超强的 o3 模型，不少 OpenAI 和硅谷的研究者正在讨论 AGI （通用人工智能）即将到来。R1 发布后，行业焦点变成 DeepSeek，一些媒体用 "DeepShock" 形容它带来的冲击。市值大跌的英伟达、台积电，现在已经开始反弹 2025 年 1 月的全球 AI 大事记。文丨贺乾明编辑丨程曼祺 2025 年 1 月的 AI 月报，你会看到：以下是我们第 3 期 AI 月报，欢迎大家在留言区补充我们没有提到的重要进展。格局丨D ...

AI 月报：马斯克加速 GPU 竞赛；大模型真撞墙了？风口转到 Agent

晚点LatePost· 2024-12-11 14:30

新栏目上线试运行。文丨贺乾明编辑丨黄俊杰到了 11 月，越来越多的人说，成就 OpenAI 的这条路似乎撞到了墙：多家媒体报道，Google、OpenAI、Anthropic 等公司，开发下一代模型时，都没能像前些年那样让模型能力大幅提升。硅谷风投 a16z 创始合伙人、投资了 OpenAI 等多家大模型公司的马克·安德森（Marc Andreessen）说："我们以相同的速度增加（GPU），根本没有智能提升。" OpenAI 联合创始人、前首席科学家伊尔亚·苏茨克维 (Ilya Sutskever) 说："2010 年代是扩大规模的时代，现在我们再次回到了需要奇迹和新发现的时代。" 这些公司的高管否认了 "撞墙" 的说法，也有证据表明他们仍在想办法突破，毕竟建设更大规模的算力中心的势头并没有放缓，甚至还在加速。他们同步在大模型应用上倾注更多的资源。从 OpenAI、Anthropic 到 Google、微软，再到风投机构，都把 Agent——让大模型理解人类指令，调度数据库和工具完成复杂任务的系统——当作下一个赛点。 11 月，ChatGPT 迎来两周年，却是 OpenAI 官方相对沉 ...