Workflow
AI推理
icon
Search documents
软银收购Ampere Computing
半导体行业观察· 2025-03-20 01:19
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容编译自 NYT ,谢谢。 软银周三表示,已同意以 65 亿美元收购硅谷芯片初创公司Ampere Computing,加倍押注源自智能 手机的技术将主导全球数据中心。 这笔交易还反映了这家日本企业集团的信念,即 Ampere 的芯片可以开始在人工智能领域发挥重要 作用,而英伟达迄今为止在该领域获得了最多的回报。 Ampere 成立于八年前,主要销售基于 Arm Holdings 技术的数据中心芯片。Arm Holdings 是一家 英国公司,其授权的芯片设计已为几乎所有手机提供支持。软银于 2016 年收购了 Arm,并一直致 力于让基于 Arm 技术的芯片得到更广泛的应用,并用于不同的任务。 软银董事长兼首席执行官孙正义在准备好的讲话中表示:"人工智能的未来需要突破性的计算能 力。""Ampere 在半导体和高性能计算方面的专业知识将有助于加速这一愿景,并深化我们对美国人 工智能创新的承诺。" 软银表示,将以自己的名义将 Ampere 作为全资子公司进行运营。 此次出售正值一系列交易和联盟变动之际,这些交易和联盟变动的背后是市场对用于支持 OpenAI 的 ...
解读英伟达的最新GPU路线图
半导体行业观察· 2025-03-20 01:19
如果您希望可以时常见面,欢迎标星收藏哦~ Nvidia 在很大程度上拥有 AI 训练,并且如今在 AI 推理方面占有很大的份额,尤其是基础和推理 模型。所以你可能会认为路线图上没有具体信息。但 Nvidia 也让世界上很多人想知道对 AI 计算的 需求是否最终会减弱,或者至少会用更便宜的替代品来满足。此外,作为其最大客户的所有超大规 模和云构建者也在构建自己的 CPU 和 AI 加速器;公开的路线图是为了提醒他们 Nvidia 致力于构 建比他们更好的系统——并让我们都知道,这样我们就可以跟踪谁在实现他们的里程碑,谁没有。 Nvidia 的路线图非常宏大,它拥有 GPU、CPU、纵向扩展网络(用于跨 GPU 和有时 CPU 共享内 存的内存原子互连)和横向扩展网络(用于更松散地将共享内存系统相互连接)。它还有 DPU,即 具有本地化 CPU 和有时 GPU 处理的高级 NIC,以下路线图中未显示这些产品: Quantum 系列 InfiniBand 交换机的容量增长也同样不尽如人意,也没有入选。对于人工智能领域来 说,InfiniBand 的重要性越来越低,因为人工智能领域希望能够进一步扩展,而基于 Infi ...
深度解读黄仁勋GTC演讲:全方位“为推理优化”,“买越多、省越多”,英伟达才是最便宜!
硬AI· 2025-03-19 06:03
作者 |赵雨荷 编辑 | 硬 AI 当地时间3月18日周二,英伟达CEO黄仁勋在加州圣何塞举行的英伟达AI盛会GTC 2025上发表主题演 讲。美国知名半导体咨询机构Semianalysis深度解读黄仁勋GTC演讲,详细阐述英伟达在推动AI推理性能 提升方面的最新进展。 市场担心的是,DeepSeek式的软件优化以及英伟达主导的硬件进步带来的巨大成本节省,可能导致对AI 硬件的需求下降。然而,价格会影响需求,当AI成本降低时,AI能力的边界不断被突破,而需求随之增 加。 随着英伟达在硬件和软件方面的推理效率提升,使得模型推理和智能代理的部署成本大幅降低,从而实现 成本效益的扩散效应,实际的消费量反而会增加,正如英伟达的口号所说的那样:"买越多、省越多"。 点击 上方 硬AI 关注我们 Semianalysis表示,在GTC2025大会上,英伟达推出的推理Token扩展、推理堆栈与Dynamo技术、共封装光学 (CPO)技术等创新将显著降低AI总拥有成本,使得高效推理系统的部署成本大幅下降,并巩固了英伟达在全球AI生态 系统中的领先地位。 硬·AI 以下为文章的核心观点: 推理Token扩展:预训练、后训练与推 ...
速递|从训练到推理:AI芯片市场格局大洗牌,Nvidia的统治或有巨大不确定性
Z Finance· 2025-03-14 11:39
图片来源: Unsplash Nvidia 在 AI 芯片领域的霸主地位正面临挑战,初创公司 DeepSeek 等竞争对手,正抓住 AI 计算需求 变化,试图打破其统治。 从训练到推理,AI芯片市场格局的转变 DeepSeek 的 R1 和其他推理模型,如 OpenAI 的 o3 和 Anthropic 的 Claude 3.7 ,在用户发出请求时 消耗的计算资源比之前的 AI 系统更多。 这改变了 AI 计算需求的重点,直到最近,这一需求还主要集中在模型的训练或创建上。随着个人和 企业,对超越目前聊天机器人(如 ChatGPT 或 xAI 的 Grok )应用的需求增长, 推理预计将在技术 需求中占据更大比重。 Nvidia 的竞争对手,从 Cerebras 和 Groq 等 AI 芯片制造商初创公司,到谷歌、亚马逊、微软和 Meta 等大型科技公司,定制加速处理器——正集中力量,试图颠覆这家全球最有价值的半导体公司。 "训练让 AI 成长,而推理则是 AI 的应用。" Cerebras 的CEO Andrew Feldman 表示," AI 的使用量 已经大幅飙升,目前打造一款在推理方面远胜于训练的芯片, ...
特朗普试图废除拜登芯片法案;麦当劳开始“AI改造” | 硅谷周报
创业邦· 2025-03-10 10:20
快鲤鱼 . 创业邦旗下AGI矩阵号,寻找海内外创新性的AGI高成长公司,记录AGI商业领袖的成长轨迹。 「硅谷周报」是创业邦推出的系列栏目,旨在为科技领域创业者和投资人精选硅谷科技要闻,投融资 消息等,记录硅谷科技风向变动。 整理 | 刘杨楠 编辑 | 海腰 本周(2025.3.3-3.9)硅谷科技要闻包括: 特朗普欲废除拜登芯片法案;微软积极开发AI推理模型; 亚马逊成立团队专注代理AI;苹果推出搭载最新M4芯片的新款MacBook Air;马斯克的xAI在超级计 算机扩张期间在孟菲斯购买新房产;英国自动驾驶初创公司Wayve进军德国,开设新测试和开发中 心;麦当劳正对其餐厅进行人工智能改造等。 里程碑 特朗普欲废除拜登芯片法案 以下文章来源于快鲤鱼 ,作者刘杨楠 亚马逊成立团队专注代理AI 亚马逊AWS近日成立了一个专注于代理AI(Agentic AI)的新团队。 该团队将由AWS高管Swami Sivasubramanian领导,他此前曾负责AWS的AI和数据团队。AWS首席执 行官Matt Garman在内部邮件中表示,代理AI有望成为AWS的下一个十亿美元业务。 亚马逊上周展示了其语音助手Alexa ...
英伟达电话会全记录,黄仁勋都说了什么?
华尔街见闻· 2025-02-27 11:09
周三美股盘后,英伟达CEO黄仁勋在2025财年第四季度财报电话会议上表示,公司对AI推理带来的潜 在需求感到兴奋,这类计算需求预计将远超当前的大语言模型(LLM),可能需要比现有计算能力高出 数百万倍。 黄仁勋称,我们所做的事情并不容易,但英伟达在提升供应能力方面表现良好。AI软件将是一切数据中 心的一部分,无论是短期、中期还是长期迹象都持续向好。他进一步确认, Blackwell系列芯片的供应 链问题已完全解决 ,供应问题不曾妨碍到下一次训练和后续产品的研发。此外, Blackwell Ultra计划 于2025年下半年发布 。 对于DeepSeek,黄仁勋表示,DeepSeek-R1这样的推理模型,应用了推理时间扩展,推理模型可以 消耗100倍更多的计算量,未来的推理模型可以消耗更多的计算量。黄仁勋还表示,DeepSeek-R1激发 了全球的热情,这是一个出色的创新。但更重要的是,它开源了一个世界级的推理AI模型。 黄仁勋还指出,任何人都处在新科技转型的起点,所有软件和服务都将和AI相关。 英伟达CFO Colette Kress指出,感恩节和圣诞节期间的游戏硬件需求依然强劲,但整体营收仍受到供 应限制的 ...
英伟达 和预期的数一模一样
小熊跑的快· 2025-02-26 23:17
2025年Q4 393亿美元( 我们昨天给的测算结果是390-395亿 );环比增长12%,同比增长78%,全年收 入达到1305亿美元,同比增长114%。 2026Q1指引430亿美元( 我们测算的预期是425-430亿 )环比增长2%。公司这个季度毛利率预计 在70.6%至71%之间。比2024年75%低,但比市场心里底线65%高。 整体评价就是和我测算的"一模一样",但是也超了华尔街一致预期一丢丢的。但 盘后没涨。 整 体表现还不及另外一个数据库公司snowflake。 call back 会议要点: 1) 四季度数据中心依旧是最好的业务。 2025财年数据中心收入为1152亿美元,比去年增长超过一倍。四季度的数据中心收入为356亿美 元,创下新纪录,环比增长16%,同比增长93%,随着Blackwell架构的发布和Hopper 200的扩 展,数据中心的增长持续加速。 游戏 方 面,Q4收入为25亿美元,环比下降22%,同比下降11%。不过,全年收入为114亿美元, 同比增长9%。假期期间需求依然强劲,但四季度的出货量受到供应链限制的影响。预计第一季度 出货量将恢复增长,新一代的GeForce RTX ...