Workflow
推理
icon
Search documents
速递|与微软再对弈,OpenAI向CoreWeave注资120亿美元
Z Potentials· 2025-03-11 03:27
这笔交易涉及 OpenAI 获得 CoreWeave 价值 3.5 亿美元的股权。据悉,此次私募配售与 CoreWeave 计划中的 IPO 是分开进行的,此举为该 CoreWeave 在 预计 350 亿美元的公开上市前增添了动力。 图片来源: Unsplash 在一场激烈对决的棋局中, OpenAI 与 GPU 资源丰富的云服务提供商 CoreWeave 签署了一项为期五年、价值 119 亿美元的协议,据路透社援引接近交易的 人士透露。 CoreWeave 上周提交了上市申请,但尚未确定发行价格或首次公开募股的时间。 2024 年,微软占 CoreWeave 收入的 62% ,其收入增长至惊人的 19 亿美元——相较于 2023 年的 2.289 亿美元,几乎增长了八倍。 由持股 6% 的 Nvidia 支持, CoreWeave 运营着一项专为 AI 设计的云服务,截至 2024 年底,其拥有 32 个数据中心网络,运行着超过 25 万台 Nvidia GPU 。 公司表示,自那时起, CoreWeave 已增加了更多 GPU ,包括 Nvidia 最新产品 Blackwell ,该产品支持 AI 推理 ...
AI转向”推理模型和Agent时代“,对AI交易意味着什么?
硬AI· 2025-03-10 10:32
点击 上方 硬AI 关注我们 如果Scaling Law继续有效, 继续看好AI系统组件供应商(如芯片、网络设备等),谨慎对待那些不得不持续投入巨额资 本支出的科技巨头。如果预训练缩放停滞: 看好科技巨头(因为自由现金流将回升),并关注那些拥有大量用户、能够 从推理成本下降中获益的应用类股票。 硬·AI 作者 |硬 AI 编辑 | 硬 AI 还抱着"越大越好"的AI模型不放?华尔街投行巴克莱最新研报给出了一个颠覆性的预测: AI行业正经历一 场"巨变"(Big Shift),"推理模型"和"Agent"将成为新时代的弄潮儿,而"大力出奇迹"的传统大模型, 可能很快就要过气了! 这场变革的核心,是AI模型从"死记硬背"到"举一反三"的进化。过去,我们追求更大的模型、更多的参 数、更海量的训练数据,坚信"量变产生质变"。但现在,巴克莱指出,这条路可能已经走到了尽头。 算力无底洞、成本高企、收益却难以匹配……传统大模型的"军备竞赛"让众多科技巨头苦不堪言。更要命 的是,用户真的需要那么"大"的模型吗?在许多场景下,一个更"聪明"、更会推理的小模型,反而能提供 更精准、更高效的服务。 这究竟是怎么回事?对于投资者来说 ...
特朗普试图废除拜登芯片法案;麦当劳开始“AI改造” | 硅谷周报
创业邦· 2025-03-10 10:20
快鲤鱼 . 创业邦旗下AGI矩阵号,寻找海内外创新性的AGI高成长公司,记录AGI商业领袖的成长轨迹。 「硅谷周报」是创业邦推出的系列栏目,旨在为科技领域创业者和投资人精选硅谷科技要闻,投融资 消息等,记录硅谷科技风向变动。 整理 | 刘杨楠 编辑 | 海腰 本周(2025.3.3-3.9)硅谷科技要闻包括: 特朗普欲废除拜登芯片法案;微软积极开发AI推理模型; 亚马逊成立团队专注代理AI;苹果推出搭载最新M4芯片的新款MacBook Air;马斯克的xAI在超级计 算机扩张期间在孟菲斯购买新房产;英国自动驾驶初创公司Wayve进军德国,开设新测试和开发中 心;麦当劳正对其餐厅进行人工智能改造等。 里程碑 特朗普欲废除拜登芯片法案 以下文章来源于快鲤鱼 ,作者刘杨楠 亚马逊成立团队专注代理AI 亚马逊AWS近日成立了一个专注于代理AI(Agentic AI)的新团队。 该团队将由AWS高管Swami Sivasubramanian领导,他此前曾负责AWS的AI和数据团队。AWS首席执 行官Matt Garman在内部邮件中表示,代理AI有望成为AWS的下一个十亿美元业务。 亚马逊上周展示了其语音助手Alexa ...
草稿链代替思维链,推理token砍掉80%,显著降低算力成本和延迟
量子位· 2025-03-10 03:29
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 推理token减少80%-90%,准确率变化不大,某些任务还能增加。 Zoom团队提出思维链替代品"草稿链",显著降低延迟和算力成本。 原理很简单,要求模型为每个推理步骤生成简洁、信息密集的token。 这一思路受到人类解题过程启发,人类通常不会详细阐述每一个细节,只是简单几下关键的中间结果,作为草稿来辅助思考。 此外,草稿链方法简单且易于实现,不需要修改模型、微调或强化学习,只需更新提示词中的示例即可,相关代码和数据已在GitHub上开 源。 研究团队认为,与另一种降低延迟和计算成本的方法"在连续潜空间推理"相比,草稿链保留了可解释性,且可以应用于闭源的黑盒模型。 第三方分析测算,对于每个月处理100万个推理请求的企业, 可以将成本从思维链的3800美元降低到760美元,每月节省超过3000美元。 实验遵循原始思维链论文,评估3类任务:算术推理、常识推理和符号推理。 算数推理任务选择GSM8k数据集,从准确率看,标准提示下GPT-4o和Claude 3.5 Sonnet的准确率分别仅53.3%和64.6%,思维链使两者均 超95%,草稿链也达到91%左右 ...
GPT-5 有了雏形;OpenAI 和 Manus 研发 Agent 的经验;中国大公司扩大算力投资丨 AI 月报
晚点LatePost· 2025-03-08 12:17
2025 年 2 月的全球 AI 重要趋势。 文 丨 贺乾明 2025 年 2 月的 AI 月报,你会看到: 硅谷巨头的新共识:推理能力是大模型的一部分 OpenAI 和 Manus 的 Agent 开发经验 DeepSeek 推动中国大公司加大算力投入,阿里、字节两家加起来,今年就超过 2000 亿 3 家售价过亿的 AI 公司和 23 家获得超过 5000 万美元融资的 AI 公司 OpenAI 时薪 100 美元招专家生产数据提高模型能力 这一期月报中,我们开始邀请研究者、创业者和投资人提供一手视角的对每月 AI 趋势和标志性事件的评述和 洞察。 晚点 AI 月报,每月选取最值得你知道的 AI 信号。 以下是我们第 4 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要趋势。 技术丨GPT-5 雏形出现,行业新共识诞生 DeepSeek 带来的冲击波继续扩散,全球大模型公司陷入混战:不论是马斯克用超过 10 万张 GPU 训练 的 Grok 3,还是 OpenAI 可能投入 10 亿美元训练的 GPT-4.5,或是 Anthropic 融合推理(reasoning) 能力的最新模型 Claude 3 ...
雷军终于对绿牌下手了!两会提议优化绿牌设计;夸克AI上线「深度思考」,从找答案进阶给方案;罗永浩挖来小米前50号员工做AIOS
雷峰网· 2025-03-05 00:28
1.新能源车牌成两会热议话题,雷军:绿色号牌与车体颜色兼容性差,理想高管:最大问题是没设计感 2. 传腾讯元宝半个月投了近3亿元做推广,CEO曾表示看到明确机遇会毫不犹豫加大投入 3. 石头科技2024年总营收119.27亿元,海外业务收入大幅提升,营销案例出圈 4. 奔驰中国"N+9"裁员更多消息曝光:拟重整中国团队、全面应对新造车 5.卢伟冰回应小米 15 Ultra海外定价高于苹果iPhone 16 Pro Max:小米的技术信心和底气 6.鸿蒙智行法务官博上线:某公司操纵数十家MCN机构抹黑,多人被依法逮捕 7.Sam Altman:OpenAI的GPU已耗尽,GPT-4.5发布将分阶段进行 8.股价已暴跌4成!特斯拉董事长抛售巨额股票套现 2月13日,腾讯元宝宣布接入DeepSeek后,开始在各个渠道凶猛投放广告。据悉,元宝的广告几乎刷遍 了包括腾讯系App在内的所有平台。连腾讯系里最"高冷"的微信,都成了元宝的导流工具。"腾讯系产品 也几乎没有为了导流,能直接进入九宫格的。何况还直接给打上了诱导下载的标签。"有腾讯人士表示。 与之对比,曾被视为微信电商希望的"微信小店",至今也未获得准入。 从Ap ...
【海外TMT】优必选极氪5G智慧工厂实训效果突出,有望推动群体智能与规模化应用——海外机器人系列跟踪报告(五)(付天姿/黄铮)
光大证券研究· 2025-03-04 09:36
特别申明: 本订阅号中所涉及的证券研究信息由光大证券研究所编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究 信息和研究观点的沟通交流。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号 难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相 关人员为光大证券的客户。 报告摘要 事件: 近日,优必选在极氪5G智慧工厂成功开展全球首例多台、多场景、多任务人形机器人协同实训,通过群体 智能技术实现从"单机自主"向"群体智能"的跨越,探索工业场景下通用人形机器人群体作业解决方案。 群体智能架构体系创新,研发全球首个人形机器人多模态推理大模型 1)技术框架:优必选首次将群体智能技术应用于人形机器人,创新提出人形机器人群脑网络(BrainNet)软 件架构,设计人形智能网联中枢Internet of Humanoids(IoH)。其中BrainNet架构由云端协同的推理型和技 能型节点灵活链接,形成超级大脑和智能小脑。超级大脑基于多模态具身推理大模型,突破智能混合决策 技术,实现复杂产线级任务的高维决策;智能小脑基于Transformer模 ...
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
量子位· 2025-03-04 04:51
要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准,各家模型出街时人 手一份,但局限性也开始暴露,比如覆盖范围狭窄(通常不足 50 个学科),不含长尾知识;缺乏足够挑战性和区分度,比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。 不过别慌,大模型通用知识推理评测"强化版"来了,堪称大模型评测里的"黄冈密卷"! 允中 发自 凹非寺 量子位 | 公众号 QbitAI 大模型刷榜 MMLU、屠榜 GPQA 的玩法一夜变天??? 近日,字节跳动豆包大模型团队联合 M-A-P 开源社区,推出了全新评测基准 SuperGPQA 。 我们翻看论文,细品一番,足足 256 页。据了解,该评测搭建工作耗时半年,近百位学界学者及名校硕博、业界工程师参与标注。 研究团队构建了迄今为止最全面,覆盖 285 个研究生级学科、包含 26529 道专业题目的评估体系。 实验证明,即便最强的 DeepSeek-R1 在 SuperGPQA 上准确率也才 61.82%,在及格线上挣扎,显著低于其在传统评估指标上的表现。 SuperGPQA 精准直击大模型评测 ...
英伟达(纪要):对中国的出货比例不变
海豚投研· 2025-02-28 11:07
英伟达 (NVDA.O)北京时间2月27日凌晨,美股盘后发布 2025财年第四季度财报(截至 2025年1月),电话会具体内容如下: 5)消费互联网:在生成式人工智能和深度学习用例(如推荐系统、视觉、语言理解、合成数据生成、搜索和代理式人工智能)的推动下,消费互联网收入同比增 长 3 倍; 6)企业收入:同比增长近 2 倍,原因是对模型微调、RAG 和代理人工智能工作流程以及 GPU 加速数据处理的需求不断增长; 以下是英伟达2025财年四季度的财报电话会纪要,财报解读请移步《 英伟达:Deepseek,戳破了老黄的 "皮衣"? 》 一、 英伟达 财报核心信息回顾 1、财务核心信息:2025财年第四季度是创纪录的季度,营收达393亿美元,环比增长12%,同比增长78%,高于375亿美元的预期。2025财年全年营收为1305亿美 元,较上一年增长114%。 | NVIDIA (NVDA.O) FY25Q4 Financial Performance | (in US$ million) | | | | | | | | | | | | | | | | | | | | | | | | | --- | --- | - ...
两台运行“满血版”DeepSeek,第四范式推出大模型推理一体机解决方案SageOne IA
IPO早知道· 2025-02-28 04:11
此 外 , 一 体 机 解 决 方 案 还 集 成 了 智 能 算 力 池 化 技 术 , 在 支 持 DeepSeek V3/R1 、 QWen2.5 、 LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换,GPU利用率提升 30%以上,推理性能平均提升5-10倍;同时内置大模型应用开发平台,并搭载了丰富的开箱即用AI 应用套件,帮助开发者高效开发企业级的生成式AI应用,让企业享受高效的大模型应用服务,加速AI 智能化落地进程。 具体来讲:SageOne IA大模型推理一体机解决方案,具备三大核心优势: 1) 智能算力池化,资源动态调度,突破物理机架构 大模型应用成本"一降再降"。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,第四范式日前推出大模型推理一体机解决方案SageOne IA,进一步减低了大模 型推理成本。如满血版的DeepSeek V3/R1仅需要两台一体机即可使用。 方案支持企业按需选择DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型,还预装了丰富的 AI应用套件,包括AIG ...