CUDA Tile
Search documents
Nvidia Just Gave Its CUDA Platform a Major Revamp. Will That Move the Needle for NVDA Stock?
Yahoo Finance· 2025-12-09 15:02
Nvidia's (NVDA) CEO, Jensen Huang, said the company received the most substantial advancement to its CUDA platform since its release two decades ago. The centerpiece of CUDA 13.1 is CUDA Tile. It is a new tile-based programming model that changes GPU development significantly. Programmers no longer have to micro-manage thousands of individual tasks. They can now work with "tiles" of data and let CUDA's compiler and runtime automatically determine the best way to distribute workloads. It is available in Py ...
Jim Keller:英伟达“自毁”CUDA护城河
半导体芯闻· 2025-12-09 10:36
如果您希望可以时常见面,欢迎标星收藏哦~ NVIDIA 对其 CUDA 软件堆栈进行了一次重大升级,而标志性的芯片架构师 Jim Keller 认为,这可能标志着该软件独占性的结束。 可以说,迄今为止,在人工智能热潮的推动下,CUDA 在为开发者提供用于创建人工智能工作流程的特定库和框架方面,几乎垄断了 NVIDIA 的 所有市场。据我们所知,没有其他公司能够成功复制如此强大的软件栈。在此基础上,NVIDIA 推出了 CUDA 的一项重大更新——CUDA Tile, 它将传统的 SIMT 方法转变为基于 tile 的方法。我们将在后文中深入探讨这项更新,但芯片架构师 Jim Keller 认为,这或许标志着 CUDA 的护 城河即将终结。 在此次更新之前,CUDA 赋予程序员很大的自主权,让他们可以精细调整诸如图块大小、共享内存中加载的数据以及 GPU 执行所需的计算资源 等参数。但 CUDA Tile 的出现彻底改变了这一切。 NVIDIA 引入了一种基于图块的编程模型和一个名为 Tile IR 的全新底层虚拟机,它将 GPU 视为一个图块处理器。这使得程序员能够将更多精力 集中在核心逻辑上,而不是 GPU ...
AI日报丨英伟达推出CUDA 13.1 与 CUDA Tile,百度旗下昆仑芯拟赴港上市
美股研究社· 2025-12-08 11:18
整理 | 美股研究社 在这个快速 变 化的 时代, 人工 智能技术正以前所未有的速度发展,带来了广泛的机会 。 《AI日 报 》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的行 业 洞察和 价 值 分析。 A I 快 报 【百度旗下昆仑芯拟赴港上市:曾考虑A股,年营收超寒武纪和摩尔线程】 百度旗下AI芯片公司昆仑芯正在筹备赴香港上市。接近昆仑芯投资人告诉记者,早些时候昆仑 芯曾准备筹备科创板上市,在与多家券商进行沟通后,于今年下半年决定转向港股。此前,昆 仑芯曾开启一轮融资,投前估值超过250亿元人民币。 【软银洽谈收购数据中心私募DigitalBridge,希望借机把握AI基础设施热潮】 孙正义旗下软银集团正与专注于数据中心等数字基础设施投资的私募股权公司DigitalBridge Group Inc.洽谈收购事宜,旨在利用由人工智能(AI)驱动的计算能力需求的激增。这项潜在 交易涉及将市值约18亿美元的DigitalBridge私有化,最快可能在未来几周内达成,但谈判仍 在进行中。此举与软银创始人孙正义 (Masayoshi Son) 将资本重新投入AI的战略一致,包括 他此前宣布的与Op ...
英伟达自毁CUDA门槛,15行Python写GPU内核,性能匹敌200行C++
3 6 Ke· 2025-12-08 07:23
GPU编程变天了。 英伟达发布最新版CUDA 13.1,官方直接定性:这是自2006年诞生以来最大的进步。 核心变化是推出全新的CUDA Tile编程模型,让开发者可以用Python写GPU内核,15行代码就能达到200行CUDA C++代码的性能。 消息一出,芯片界传奇人物Jim Keller立即发问: 英伟达是不是亲手终结了CUDA的"护城河"?如果英伟达也转向Tile模型,AI内核将更容易移植到其他硬件上。 Jim Keller参与设计过AMD Zen架构、苹果A系列芯片、特斯拉自动驾驶芯片的"硅仙人",他的判断在行业里相当有分量。 那么问题来了:CUDA这次到底改了什么?为什么会被认为是"自毁长城"? GPU编程范式从"线程"到"瓦片" 要理解这次更新的意义,得先回顾一下传统CUDA编程有多折磨人。 过去20年,CUDA一直采用SIMT(单指令多线程)模型,开发者写代码时,需要手动管理线程索引、线程块、共享内存布局、线程同步,每一个细节都 要自己操心。 想要充分利用GPU性能,特别是用上Tensor Core这类专用模块,更是需要深厚的经验积累。 CUDA Tile彻底改变了这套玩法: 开发者不再需要 ...
刚刚,英伟达CUDA迎来史上最大更新!
具身智能之心· 2025-12-08 01:11
作者丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 几个小时前, NVIDIA CUDA Toolkit 13.1 正式发布, 英伟达官方表示: 「这是 20 年来最大的一次更新。」 这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括: 下面我们就来具体看看。 CUDA Tile CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。 它是一种基于 tile 的编程模型,能够以更高的层次编写算法,并抽象化专用硬件(例如张量核心)的细 节。 NVIDIA CUDA Tile 的发布, 这是英伟达基于 tile 的编程模型,可用于抽象化专用硬件,包括张量核心。 Runtime API exposure of green contexts (是指把所谓的 Green Context「指轻量级的、可并发调度的上下文或执行环境」暴露给外部调用者使用。) NVIDIA cuBLAS 中的双精度和单精度仿 ...
英伟达(NVDA.US)推出CUDA 13.1 与 CUDA Tile 黄仁勋称二十年来最大升级
智通财经网· 2025-12-06 04:18
英伟达工程师指出:"基于图块的编程允许您通过指定数据块(即图块)来编写算法,然后定义对这些图 块执行的计算操作。您无需在逐元素级别设置算法的执行方式:编译器和运行时会为您处理好这一 切。" CUDA Tile 在 Python 中也有可用版本。英伟达计划在未来某个时候发布与 C++ 兼容的版本。英伟达 CUDA 架构师Stephen Jones说道:"它刚刚在 Python 中得以实现,我认为这与人工智能开发框架的结合 非常完美。我们有意将 CUDA Tile 前沿语言作为开源项目进行发布。" CUDA 是由英伟达公司开发的一种并行计算平台及编程模型。它能够帮助开发者利用图形处理单元的 强大计算能力来提升应用程序的运行速度。新的基于图元的编程选项使开发人员能够"精细地控制"其代 码的执行方式,尤其是在涉及多种 GPU 架构的情况下。 智通财经APP获悉,英伟达(NVDA.US)推出了 CUDA 13.1 和 CUDA Tile,该公司CEO黄仁勋表示这是 该平台自约 20 年前推出以来所取得的最大进步。英伟达工程师Jonathan Bentz与Tony Scudiero在一篇博 客文章中表示:"这一令人兴奋的 ...
刚刚,英伟达CUDA迎来史上最大更新!
机器之心· 2025-12-06 04:08
机器之心报道 机器之心编辑部 几个小时前, NVIDIA CUDA Toolkit 13.1 正式发布, 英伟达官方表示: 「这是 20 年来最大的一次更新。」 这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括: 下面我们就来具体看看。 CUDA Tile CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。 它是一种基于 tile 的编程模型,能够以更高的层次编写算法,并抽象化专用硬件(例如张量核心)的细 节。 NVIDIA CUDA Tile 的发布, 这是英伟达基于 tile 的编程模型,可用于抽象化专用硬件,包括张量核心。 Runtime API exposure of green contexts (是指把所谓的 Green Context「指轻量级的、可并发调度的上下文或执行环境」暴露给外部调用者使用。) NVIDIA cuBLAS 中的双精度和单精度仿真。 一本完全重写的 CUDA 编程指南 , 专为 CUDA 新手和高级程序员设计。 解读 CUDA Tile 的核心概念 英伟达博客解释说: CUDA Tile 可让开发者在高于 SIMT ...