推理 - filings, earnings calls, financial reports, news

推理

Search documents

Z Potentials· 2025-03-11 03:27

这笔交易涉及 OpenAI 获得 CoreWeave 价值 3.5 亿美元的股权。据悉，此次私募配售与 CoreWeave 计划中的 IPO 是分开进行的，此举为该 CoreWeave 在预计 350 亿美元的公开上市前增添了动力。图片来源： Unsplash 在一场激烈对决的棋局中， OpenAI 与 GPU 资源丰富的云服务提供商 CoreWeave 签署了一项为期五年、价值 119 亿美元的协议，据路透社援引接近交易的人士透露。 CoreWeave 上周提交了上市申请，但尚未确定发行价格或首次公开募股的时间。 2024 年，微软占 CoreWeave 收入的 62% ，其收入增长至惊人的 19 亿美元——相较于 2023 年的 2.289 亿美元，几乎增长了八倍。由持股 6% 的 Nvidia 支持， CoreWeave 运营着一项专为 AI 设计的云服务，截至 2024 年底，其拥有 32 个数据中心网络，运行着超过 25 万台 Nvidia GPU 。公司表示，自那时起， CoreWeave 已增加了更多 GPU ，包括 Nvidia 最新产品 Blackwell ，该产品支持 AI 推理 ...

AI转向”推理模型和Agent时代“，对AI交易意味着什么？

硬AI· 2025-03-10 10:32

点击上方硬AI 关注我们如果Scaling Law继续有效，继续看好AI系统组件供应商（如芯片、网络设备等），谨慎对待那些不得不持续投入巨额资本支出的科技巨头。如果预训练缩放停滞：看好科技巨头（因为自由现金流将回升），并关注那些拥有大量用户、能够从推理成本下降中获益的应用类股票。硬·AI 作者 |硬 AI 编辑 | 硬 AI 还抱着"越大越好"的AI模型不放？华尔街投行巴克莱最新研报给出了一个颠覆性的预测： AI行业正经历一场"巨变"（Big Shift），"推理模型"和"Agent"将成为新时代的弄潮儿，而"大力出奇迹"的传统大模型，可能很快就要过气了！这场变革的核心，是AI模型从"死记硬背"到"举一反三"的进化。过去，我们追求更大的模型、更多的参数、更海量的训练数据，坚信"量变产生质变"。但现在，巴克莱指出，这条路可能已经走到了尽头。算力无底洞、成本高企、收益却难以匹配……传统大模型的"军备竞赛"让众多科技巨头苦不堪言。更要命的是，用户真的需要那么"大"的模型吗？在许多场景下，一个更"聪明"、更会推理的小模型，反而能提供更精准、更高效的服务。这究竟是怎么回事？对于投资者来说 ...

推理模型

Agent

Chinchilla缩放定律

Artificial Intelligence

Artificial Intelligence

ChatGPT

DeepSeek的R1模型

特朗普试图废除拜登芯片法案；麦当劳开始“AI改造” | 硅谷周报

创业邦· 2025-03-10 10:20

快鲤鱼 . 创业邦旗下AGI矩阵号，寻找海内外创新性的AGI高成长公司，记录AGI商业领袖的成长轨迹。「硅谷周报」是创业邦推出的系列栏目，旨在为科技领域创业者和投资人精选硅谷科技要闻，投融资消息等，记录硅谷科技风向变动。整理 | 刘杨楠编辑 | 海腰本周（2025.3.3-3.9）硅谷科技要闻包括：特朗普欲废除拜登芯片法案；微软积极开发AI推理模型；亚马逊成立团队专注代理AI；苹果推出搭载最新M4芯片的新款MacBook Air；马斯克的xAI在超级计算机扩张期间在孟菲斯购买新房产；英国自动驾驶初创公司Wayve进军德国，开设新测试和开发中心；麦当劳正对其餐厅进行人工智能改造等。里程碑特朗普欲废除拜登芯片法案以下文章来源于快鲤鱼，作者刘杨楠亚马逊成立团队专注代理AI 亚马逊AWS近日成立了一个专注于代理AI（Agentic AI）的新团队。该团队将由AWS高管Swami Sivasubramanian领导，他此前曾负责AWS的AI和数据团队。AWS首席执行官Matt Garman在内部邮件中表示，代理AI有望成为AWS的下一个十亿美元业务。亚马逊上周展示了其语音助手Alexa ...

草稿链代替思维链，推理token砍掉80%，显著降低算力成本和延迟

量子位· 2025-03-10 03:29

梦晨发自凹非寺量子位 | 公众号 QbitAI 推理token减少80%-90%，准确率变化不大，某些任务还能增加。 Zoom团队提出思维链替代品"草稿链"，显著降低延迟和算力成本。原理很简单，要求模型为每个推理步骤生成简洁、信息密集的token。这一思路受到人类解题过程启发，人类通常不会详细阐述每一个细节，只是简单几下关键的中间结果，作为草稿来辅助思考。此外，草稿链方法简单且易于实现，不需要修改模型、微调或强化学习，只需更新提示词中的示例即可，相关代码和数据已在GitHub上开源。研究团队认为，与另一种降低延迟和计算成本的方法"在连续潜空间推理"相比，草稿链保留了可解释性，且可以应用于闭源的黑盒模型。第三方分析测算，对于每个月处理100万个推理请求的企业，可以将成本从思维链的3800美元降低到760美元，每月节省超过3000美元。实验遵循原始思维链论文，评估3类任务：算术推理、常识推理和符号推理。算数推理任务选择GSM8k数据集，从准确率看，标准提示下GPT-4o和Claude 3.5 Sonnet的准确率分别仅53.3%和64.6%，思维链使两者均超95%，草稿链也达到91%左右 ...

GPT-5 有了雏形；OpenAI 和 Manus 研发 Agent 的经验；中国大公司扩大算力投资丨 AI 月报

晚点LatePost· 2025-03-08 12:17

2025 年 2 月的全球 AI 重要趋势。文丨贺乾明 2025 年 2 月的 AI 月报，你会看到：硅谷巨头的新共识：推理能力是大模型的一部分 OpenAI 和 Manus 的 Agent 开发经验 DeepSeek 推动中国大公司加大算力投入，阿里、字节两家加起来，今年就超过 2000 亿 3 家售价过亿的 AI 公司和 23 家获得超过 5000 万美元融资的 AI 公司 OpenAI 时薪 100 美元招专家生产数据提高模型能力这一期月报中，我们开始邀请研究者、创业者和投资人提供一手视角的对每月 AI 趋势和标志性事件的评述和洞察。晚点 AI 月报，每月选取最值得你知道的 AI 信号。以下是我们第 4 期 AI 月报，欢迎大家在留言区补充我们没有提到的重要趋势。技术丨GPT-5 雏形出现，行业新共识诞生 DeepSeek 带来的冲击波继续扩散，全球大模型公司陷入混战：不论是马斯克用超过 10 万张 GPU 训练的 Grok 3，还是 OpenAI 可能投入 10 亿美元训练的 GPT-4.5，或是 Anthropic 融合推理（reasoning）能力的最新模型 Claude 3 ...

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

雷军终于对绿牌下手了！两会提议优化绿牌设计；夸克AI上线「深度思考」，从找答案进阶给方案；罗永浩挖来小米前50号员工做AIOS

雷峰网· 2025-03-05 00:28

1.新能源车牌成两会热议话题，雷军：绿色号牌与车体颜色兼容性差，理想高管：最大问题是没设计感 2. 传腾讯元宝半个月投了近3亿元做推广，CEO曾表示看到明确机遇会毫不犹豫加大投入 3. 石头科技2024年总营收119.27亿元，海外业务收入大幅提升，营销案例出圈 4. 奔驰中国"N+9"裁员更多消息曝光：拟重整中国团队、全面应对新造车 5.卢伟冰回应小米 15 Ultra海外定价高于苹果iPhone 16 Pro Max：小米的技术信心和底气 6.鸿蒙智行法务官博上线：某公司操纵数十家MCN机构抹黑，多人被依法逮捕 7.Sam Altman：OpenAI的GPU已耗尽，GPT-4.5发布将分阶段进行 8.股价已暴跌4成！特斯拉董事长抛售巨额股票套现 2月13日，腾讯元宝宣布接入DeepSeek后，开始在各个渠道凶猛投放广告。据悉，元宝的广告几乎刷遍了包括腾讯系App在内的所有平台。连腾讯系里最"高冷"的微信，都成了元宝的导流工具。"腾讯系产品也几乎没有为了导流，能直接进入九宫格的。何况还直接给打上了诱导下载的标签。"有腾讯人士表示。与之对比，曾被视为微信电商希望的"微信小店"，至今也未获得准入。从Ap ...

【海外TMT】优必选极氪5G智慧工厂实训效果突出，有望推动群体智能与规模化应用——海外机器人系列跟踪报告（五）（付天姿/黄铮）

光大证券研究· 2025-03-04 09:36

特别申明：本订阅号中所涉及的证券研究信息由光大证券研究所编写，仅面向光大证券专业投资者客户，用作新媒体形势下研究信息和研究观点的沟通交流。非光大证券专业投资者客户，请勿订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限，若给您造成不便，敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相关人员为光大证券的客户。报告摘要事件：近日，优必选在极氪5G智慧工厂成功开展全球首例多台、多场景、多任务人形机器人协同实训，通过群体智能技术实现从"单机自主"向"群体智能"的跨越，探索工业场景下通用人形机器人群体作业解决方案。群体智能架构体系创新，研发全球首个人形机器人多模态推理大模型 1）技术框架：优必选首次将群体智能技术应用于人形机器人，创新提出人形机器人群脑网络(BrainNet)软件架构，设计人形智能网联中枢Internet of Humanoids(IoH)。其中BrainNet架构由云端协同的推理型和技能型节点灵活链接，形成超级大脑和智能小脑。超级大脑基于多模态具身推理大模型，突破智能混合决策技术，实现复杂产线级任务的高维决策；智能小脑基于Transformer模 ...

人形机器人群脑网络(BrainNet)软件架构

人形智能网联中枢Internet of Humanoids(IoH)

人形机器人群脑网络(BrainNet)软件架构

人形智能网联中枢Internet of Humanoids(IoH)

DeepSeek-R1、o1都在及格线挣扎！字节开源全新知识推理测评集，覆盖285个学科

量子位· 2025-03-04 04:51

要知道，过去几年，各种通用评测逐渐同质化，越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准，各家模型出街时人手一份，但局限性也开始暴露，比如覆盖范围狭窄（通常不足 50 个学科），不含长尾知识；缺乏足够挑战性和区分度，比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。不过别慌，大模型通用知识推理评测"强化版"来了，堪称大模型评测里的"黄冈密卷"！允中发自凹非寺量子位 | 公众号 QbitAI 大模型刷榜 MMLU、屠榜 GPQA 的玩法一夜变天？？？近日，字节跳动豆包大模型团队联合 M-A-P 开源社区，推出了全新评测基准 SuperGPQA 。我们翻看论文，细品一番，足足 256 页。据了解，该评测搭建工作耗时半年，近百位学界学者及名校硕博、业界工程师参与标注。研究团队构建了迄今为止最全面，覆盖 285 个研究生级学科、包含 26529 道专业题目的评估体系。实验证明，即便最强的 DeepSeek-R1 在 SuperGPQA 上准确率也才 61.82%，在及格线上挣扎，显著低于其在传统评估指标上的表现。 SuperGPQA 精准直击大模型评测 ...

海豚投研· 2025-02-28 11:07

英伟达 (NVDA.O)北京时间2月27日凌晨，美股盘后发布 2025财年第四季度财报（截至 2025年1月），电话会具体内容如下： 5）消费互联网：在生成式人工智能和深度学习用例（如推荐系统、视觉、语言理解、合成数据生成、搜索和代理式人工智能）的推动下，消费互联网收入同比增长 3 倍； 6）企业收入：同比增长近 2 倍，原因是对模型微调、RAG 和代理人工智能工作流程以及 GPU 加速数据处理的需求不断增长；以下是英伟达2025财年四季度的财报电话会纪要，财报解读请移步《英伟达：Deepseek，戳破了老黄的 "皮衣"？》一、英伟达财报核心信息回顾 1、财务核心信息：2025财年第四季度是创纪录的季度，营收达393亿美元，环比增长12%，同比增长78%，高于375亿美元的预期。2025财年全年营收为1305亿美元，较上一年增长114%。 | NVIDIA (NVDA.O) FY25Q4 Financial Performance | (in US$ million) | | | | | | | | | | | | | | | | | | | | | | | | | --- | --- | - ...

两台运行“满血版”DeepSeek，第四范式推出大模型推理一体机解决方案SageOne IA

IPO早知道· 2025-02-28 04:11

此外，一体机解决方案还集成了智能算力池化技术，在支持 DeepSeek V3/R1 、 QWen2.5 、 LLama3.3等主流大模型的基础上，企业可灵活在满血版和多个蒸馏模型之间切换，GPU利用率提升 30%以上，推理性能平均提升5-10倍；同时内置大模型应用开发平台，并搭载了丰富的开箱即用AI 应用套件，帮助开发者高效开发企业级的生成式AI应用，让企业享受高效的大模型应用服务，加速AI 智能化落地进程。具体来讲：SageOne IA大模型推理一体机解决方案，具备三大核心优势： 1）智能算力池化，资源动态调度，突破物理机架构大模型应用成本"一降再降"。本文为IPO早知道原创作者｜ Stone Jin 微信公众号｜ipozaozhidao 据IPO早知道消息，第四范式日前推出大模型推理一体机解决方案SageOne IA，进一步减低了大模型推理成本。如满血版的DeepSeek V3/R1仅需要两台一体机即可使用。方案支持企业按需选择DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型，还预装了丰富的 AI应用套件，包括AIG ...

大模型推理

生成式AI

Artificial Intelligence

SageOne IA大模型推理一体机解决方案

Artificial Intelligence

SageOne IA大模型推理一体机解决方案

DeepSeek V3/R1

QWen2.5

Previous Next