Workflow
o1 模型
icon
Search documents
硅谷模型大厂变化:对预训练和Capex的影响?
2025-07-02 15:49
硅谷模型大厂变化:对预训练和 Capex 的影响? 20250702 摘要 Meta 积极挖角 OpenAI、谷歌和 Anthropic 等公司人才,尤其集中在 多模态处理、后训练和推理模型领域,旨在提升 LLAMA 模型竞争力, 加速下一代大模型研发。 Meta 通过收购 Skill AI 加强数据筛选能力,弥补参数量不足,同时加速 集群建设,学习 OpenAI 模式,综合提升数据、人力和算力,推动下一 代模型发展。 OpenAI 的 O1 模型核心团队成员流失,任宏宇、赵胜佳和余佳慧等关 键人物被挖走,对 OpenAI 造成一定冲击,促使其加快发展步伐。 AI 人才薪酬大幅上涨,顶尖人才年薪高达一亿美元,显示科技公司对 AI 人才的争夺白热化,扎克伯格通过高薪全面压制竞争对手。 2025 年下半年,科技公司将回归预训练阶段,Meta、谷歌和 OpenAI 采取不同策略:Meta 侧重数据,谷歌优化架构,OpenAI 坚持大集群战 略。 Q&A 近期硅谷的变化对全球大模型 AI 演绎节奏有何影响? 近期硅谷的变化显著加快了全球大模型 AI 演绎的节奏。今年(2025 年)下半 年,美国将进入新一轮的大模型迭 ...
DeepSeek对英伟达长期股价的潜在影响
CHIEF SECURITIES· 2025-03-12 06:38
2025/02/11 中国宏观经济研究员 杨曦 010-66555831 xi_yang@chiefgroup.com.hk DeepSeek 对英伟达长期股价的潜在影响 1 月 27 日,DeepSeek 在中国区和美国区的苹果 App Store 免费榜上同时登顶,成为下载量第 一的应用程序。与此同时,美国科技股市场却遭遇了大幅下跌,费城半导体指数(SOX)下跌了 9.2%,创下自 2020 年 3 月以来的最大单日跌幅。其中,英伟达股价下跌了近 17%,市值蒸发了近 6000 亿美元,成为美股历史上最大规模的单日市值缩水之一。甚至 WTI 原油价格也在盘中一度下 跌了 3%。一些交易员认为,如果大模型的训练和推理不再需要大量算力,数据中心的电力需求也 会随之减少,进而减少对石油发电的依赖。 这场科技股的大幅波动,主要归因于 DeepSeek 在训练和推理成本上的显著优势。 | 模型(1) | 上下文长度 | 最大思维链长度(2) | 最大输出长度(3) | 百万tokens | 百万tokens | 百万tokens | | --- | --- | --- | --- | --- | --- | --- ...
速递|DeepSeek 声称其“理论”利润率为 545%
Z Potentials· 2025-03-02 02:37
图片来源: DeepSeek DeepSeek 最近公开其 AI 模型可能的盈利情况——但有一些附加条件。 在 X 上的一篇帖子中, DeepSeek 称 其在线服务的"成本利润率"为 545% 。该利润率是基于"理论收入"计算的。 在一篇更长的 GitHub 帖子结尾详细讨论了这些数字,概述了其实现"更高吞吐量和更低延迟"的方法。DeepSeek 写道,当它查看其 V3 和 R1 模型在 24 小 时内的使用情况时,如果所有使用都按 R1 定价计费, DeepSeek 每天的收入将达到 562,027 美元。 与此同时,租赁所需的 GPU (图形处理单元)的成本仅为 87,072 美元。 DeepSeek 承认,由于多种原因,其实际收入 "显著低于"预期,例如夜间折扣、 V3 的较低定价,以及"只有一部分服务实现了商业化",而网络和应用程序 的访问仍然是免费的。 当然,如果应用程序和网站不是免费的,并且没有其他折扣,使用量可能会显著降低。因此这更像是对未来潜在利润率的一个预估,而不是 DeepSeek 当前 现实情况。 DeepSeek 在关于人工智能成本和潜在盈利能力的更广泛讨论中分享这些数字。 Deep ...
DeepSeek 刷新全球 AI 格局;50 美元模型蒸馏术;美国公司们宣布 8000 亿美元算力投资丨AI 月报
晚点LatePost· 2025-02-10 09:50
DeepSeek 在 1 月 20 日上线 R1 模型后,凭借高性能(比肩 OpenAI o1)、低使用成本(API 价格是 o1 的 1/30)、开源模型权重 等,迅速接管 OpenAI 等公司主导的大模型叙事。 DeepSeek 怎么刷新全球大模型格局 李飞飞在内的团队如何低成本 "蒸馏" 出特定领域追赶 o1 的模型 到去年底,OpenAI 年化收入超 60 亿美元 OpenAI 的星门计划:投 5000 亿美元建算力 26 家获得超过 5000 万美元融资的 AI 公司,中国有 2 家 大模型公司的爬虫遭 "下毒" 抵抗 这之前,因为 OpenAI 展示能力超强的 o3 模型,不少 OpenAI 和硅谷的研究者正在讨论 AGI (通用人工智能)即将到来。R1 发 布后,行业焦点变成 DeepSeek,一些媒体用 "DeepShock" 形容它带来的冲击。 市值大跌的英伟达、台积电,现在已经开始反弹 2025 年 1 月的全球 AI 大事记。 文丨贺乾明 编辑丨程曼祺 2025 年 1 月的 AI 月报,你会看到: 以下是我们第 3 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要进展。 格局丨D ...
AI 月报:马斯克加速 GPU 竞赛;大模型真撞墙了? 风口转到 Agent
晚点LatePost· 2024-12-11 14:30
新栏目上线试运行。 文丨 贺乾明 编辑丨黄俊杰 到了 11 月,越来越多的人说,成就 OpenAI 的这条路似乎撞到了墙: 多家媒体报道,Google、OpenAI、Anthropic 等公司,开发下一代模型时,都没能像前些年那样让模型能力大幅提升。 硅谷风投 a16z 创始合伙人、投资了 OpenAI 等多家大模型公司的马克·安德森(Marc Andreessen)说:"我们以相 同的速度增加(GPU),根本没有智能提升。" OpenAI 联合创始人、前首席科学家伊尔亚·苏茨克维 (Ilya Sutskever) 说:"2010 年代是扩大规模的时代,现在我 们再次回到了需要奇迹和新发现的时代。" 这些公司的高管否认了 "撞墙" 的说法,也有证据表明他们仍在想办法突破,毕竟建设更大规模的算力中心的势头并没 有放缓,甚至还在加速。 他们同步在大模型应用上倾注更多的资源。从 OpenAI、Anthropic 到 Google、微软,再到风投机构,都把 Agent——让 大模型理解人类指令,调度数据库和工具完成复杂任务的系统——当作下一个赛点。 11 月,ChatGPT 迎来两周年,却是 OpenAI 官方相对沉 ...