Workflow
Groq LP30
icon
Search documents
GTC 2026 – 推理王国扩张 --- GTC 2026 – The Inference Kingdom Expands
2026-03-25 02:51
Nvidia – The Inference Kingdom Expands 英伟达 —— 推理王国扩张 Groq LP30, LPX Rack, Attention FFN Disaggregation, Oberon & Kyber Updates, Nvidia's CPO Roadmap, Vera ETL256, CMX & STX Groq LP30、LPX 机架、Attention FFN 解耦、Oberon 与 Kyber 更新、英伟达 CPO 路 线图、Vera ETL256、CMX 与 STX DYLAN PATEL, MYRON XIE, DANIEL NISHBALL, AND 7 OTHERS DYLAN PATEL, MYRON XIE, DANIEL NISHBALL 以及其他 7 位作者 MAR 24, 2026 2026 年 3 月 24 日 ∙ PAID ∙ 付费内容 1 Share 分享 27 Source: Nvidia 来源:英伟达 At GTC 2026, Nvidia delivered an event packed full of ground breakin ...
深度解读英伟达芯片路线图
半导体行业观察· 2026-03-20 00:56
公众号记得加星标⭐️,第一时间看推送不会错过。 在 GPU 加速应用程序性能的早期——实际上从 2012 年 5 月的"开普勒"数据中心 GPU 到 2017 年 5 月的"伏特"——英伟达,这家全球最重要的科技公司,也是 GenAI 革命中硬件和系统软件的绝对主 导供应商,在发布路线图方面做得非常出色。 但在2021年之前的几年里,英伟达一直把产品路线图折叠起来,放在联合创始人兼首席执行官黄仁勋 皮夹克左前内袋里。随着人工智能时代(GenAI)的蓬勃发展从化学领域转向核能领域,英伟达敏锐 地意识到,在各方都在努力协调资金、土地、电力、冷却和系统,以构建IT市场有史以来规模最大的 基础设施建设之际,每个人都需要一份真正意义上的路线图,最好是未来几年的规划路线图。第一份 这样的新时代路线图于2023年底发布,并非黄仁勋在GTC大会上展示的幻灯片,而是在一份财务报 告中。我们对这份路线图进行了大量的编辑,添加了缺失的组件,例如一些GPU和DPU,并在各列中 修正了正确的年份。但我们始终感激英伟达能够清晰地展现其现状和未来发展方向。我们收集了2021 年至2023年间所有能找到的路线图,并将它们整理到这篇文章中,供 ...
黄仁勋:龙虾就是新操作系统,英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元
3 6 Ke· 2026-03-17 07:27
Core Insights - NVIDIA's GTC 2026 showcased a significant shift in the AI industry, with CEO Jensen Huang emphasizing the company's projected revenue of at least $1 trillion by 2027, up from $500 billion last year [4][12][36] Group 1: Event Overview - The GTC 2026 featured 450 sponsoring companies, 1,000 technical sessions, 2,000 speakers, and 110 robots, resembling an annual pilgrimage for the AI industry rather than a typical tech conference [1] - Huang's keynote included a historical overview of NVIDIA's technology evolution, from the GeForce graphics card to the current AI advancements [4][36] Group 2: Token Economy - Huang introduced a comprehensive business model based on token economics, highlighting different pricing tiers for token usage, ranging from free access to $150 per million tokens for advanced tasks [9][12] - The model emphasizes the importance of token throughput and generation rates, which are critical for AI performance [9][12] Group 3: Technological Advancements - The new Vera Rubin AI computing system is described as NVIDIA's most complex, featuring seven types of chips and achieving 3.6 exaflops of computing power [15][20] - Innovations include a 100% liquid cooling solution and the introduction of Co-Packaged Optics (CPO) technology, which enhances data transmission efficiency [21][24][25] Group 4: Integration of Groq - NVIDIA's acquisition of Groq aims to enhance AI inference capabilities, with Groq's architecture designed for high-speed processing, complementing NVIDIA's GPU offerings [29][31] - The integration strategy involves separating inference tasks between Groq and Vera Rubin to optimize performance [33][35] Group 5: Future Developments - Huang announced the upcoming Feynman architecture, which will introduce new GPUs, LPUs, and CPUs, emphasizing the need for higher capacity and bandwidth in future computing solutions [44][47] - The company is also exploring the concept of "space computing" with plans for a data center in space, addressing unique challenges such as heat dissipation in a zero-gravity environment [49][50]
黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元
量子位· 2026-03-16 22:12
梦晨 henry 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达GTC 2026很不寻常,黄仁勋迟到了15分钟。 今年有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人,这样的规模已经不像一场技术会议,更像 AI行业的年度朝圣 。 皮衣老黄站在舞台中央,接受了新称号 "Token之王" 。 这次他没有直奔芯片发布,而是花了整整一个小时,从25年前的GeForce游戏显卡讲起,讲到20年前的CUDA,讲到10年前的RTX渲染技 术,讲到云计算合作伙伴,再讲到今天的爆火OpenClaw和token经济。 AI 从 感知 到 生成 到 推理 再到 执行 ,每一步都需要生成更多token,消耗更多算力。 所有这一切铺垫,只为引出一个数字: 英伟达到2027年营收预计至少达到1万亿美元。 去年GTC上,我看到了5000亿美元的高确信需求。今年,站在同一个舞台上,这个数字变成了1万亿美元,覆盖Blackwell和Rubin到 2027年的订单。 而且我确定,实际需求会比这更高。 就在这个瞬间,与现场观众的掌声和欢呼声一同高涨的是英伟达股价。 Token工厂经济学:老黄教全球CEO看一张图 只 ...