Workflow
PyTorch
icon
Search documents
开源CUDA项目起死回生,支持非英伟达芯片,濒临倒闭时神秘机构出手援助
量子位· 2025-07-08 00:40
奕然 发自 凹非寺 量子位 | 公众号 QbitAI 能让非NVIDIA芯片跑CUDA的开源项目ZLUDA,起死回生了。 最新版增加了对大模型工作负载的支持,一举登上GitHub热榜! 开发者@vosen本名Andrzej Janik,曾经在Intel工作。 该项目一度因AMD停止资助濒临破产,最终被一家神秘机构出手相救。 现在,创始人vosen带来好消息,表示ZLUDA团队新添一员猛将并稳定进行项目恢复中。 在2020年,Andrzej Janik想要尝试一下技术突破,让CUDA程序在非NVIDIA平台运行,一尝试,便有了可行性。 之后,ZLUDA被Intel接手,作为一个内部试验项目发展。 Intel分配资源给了ZLUDA,目的很明显了,让其 在Intel GPU上跑CUDA程序,作为Intel oneAPI生态的一种补充方式 。 无疑,这触碰到了NVIDIA的商业生态链。 没过多久,这个项目就被终止了。 2022年,ZLUDA得到了AMD的支持而重启,并支持AMD硬件。 好景不长,这次也仅仅维持2年,2024年2月宣布终止。 过往发展:起起伏伏又起起 一个月后,英伟达就发布CUDA 11.6版本,并明确 ...
大佬面对面!斯坦福2025 CS336课程全公开:从零开始搓大模型~
自动驾驶之心· 2025-06-24 11:47
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 从事大模型方向的小伙伴有福利了!斯坦福大学 2025 年春季的 CS336 课程「从头开始创造语言模型(Language Models from Scratch)」相关课程和材料现已在网上全面发布! 该课程教职工团队,阵容十分豪华~ 课程视频:https://www.youtube.com/watch? v=SQ3fZ1sAqXI&list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_ 课程主页:https://stanford-cs336.github.io/spring2025/ 讲师Tatsunori Hashimoto:现为斯坦福大学计算机科学系助理教授。其为斯坦福大学 John C. Duchi 和 Percy Liang 的博士后,研究机器学习模型平均性能和最差性能之间的权衡。此前在麻省理工学院攻读研究生,导师是 Tommi Jaakkola 和 David Gifford。本科就读于哈佛大学学习统计学和数学,导师是 Edoardo Airoldi。并且该讲 师的研究成果已 ...
从开源共建到生态繁荣:昇思MindSpore支持Day0迁移、一键部署
财联社· 2025-06-12 10:59
1. 迁得快:让三方框架模型 "零成本"迁移,避免重复造轮子,同时模型精度完全对齐。 2 . 部署快:训转推全流程自动化,让大模型部署像执行一行命令一般敏捷高效 。 Figure 1 MindSpore生态快速迁移解决方案的技术架构 接下来,我们将揭开昇思 MindSpore的破局之道。 一、支持训练Day0迁移,构建跨框架的"无感智能翻译"能力 当大模型架构日新月异,开发者最怕被生态绑定。昇思 MindSpore通过三重兼容术打通主流 技术栈 , 支持 主流 加速库 模型0代码迁移 ,通过精度自动对比工具 实现跨框架、跨版本、 跨策略快速调优, 精度对齐原模型, 实现 在分布式并行策略保持不变的情况下,训练性能提 升5 %+ 。 在训练生态方面,通过 MindSpeed /Megatron桥接层实现 PyTorch 模型零代码迁移,训练 脚本可直接运行; 通过动态图能力重构,昇思让 PyTorch 开发者获得"原生体验",同时借力 MSAdapter 工具自动转换9 5 %以上接口, 主流模型如 DeepSeek 、 Pan g u 等 迁移损耗 逼近于零。 大模型发展日新月异,新的大模型层出不穷,参数规模 ...
对话 PyTorch 掌门人 Matt White:AI 应用应该做到“润物细无声”
AI科技大本营· 2025-06-09 10:41
作者 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 席卷全球的 AI 淘金热中,一个词正被悄悄地掏空——那就是 "开放" 。 近日,PyTorch 基金会执行董事、Linux 基金会 AI 总经理 Matt White 在北京智源大会 揭示了一个 充满张力的现实:一方面,开源吞噬世界,AI 的开源更形成了一个自我加速的"良性循环";但另一 方面,一场围绕"开放"定义权的无声战争已经打响。 这是我们这个时代的十字路口:是任由"开放"沦为一个漂亮的营销词汇,还是为它注入坚实的灵魂? 在演讲中,Matt White 带来了两件精心铸造的"武器":一张名为 "模型开放框架"(MOF) 的地 图,用清晰的等级标准终结含糊,让真正的开放者得以彰显;以及一本名为 "OpenMDW 许可证" 的护照 ,专为 AI 模型打造,给予使用者最大限度的自由。 他的演讲,与其说是一次技术分享,不如说是一份宣言,一份行动指南。它为我们接下来这场更深入 的对话,精准地校对了焦距。 在演讲结束后,我们与 Matt White 坐下来,继续探寻这场"为开放而战"的深层动机与未来图景。 《新程序员》 :嗨 Matt,我们其实和 ...
GpuGeek如何成为AI基础设施市场的中坚力量
Jin Tou Wang· 2025-06-04 04:05
二、创新服务模式:重构AI开发体验 AI时代,算力基础设施已成为支撑技术创新和产业升级的关键要素。作为国内专注服务算法工程师群体的智算平台,GpuGeek通过持续创新的服务模式、精 准的市场定位和系统化的生态建设,正快速成长为AI基础设施领域的中坚力量。本文将深入分析GpuGeek的成功路径及其在行业中的独特价值。 一、精准定位:算法工程师的专属算力平台 GpuGeek敏锐把握市场发展趋势,将目标用户精准定位于对高质量算力有迫切需求的算法工程师群体。这一策略使平台能够深入理解专业用户的核心需求, 避免陷入同质化竞争。通过提供从RTX 4090到A800的全系列GPU资源,平台满足了从入门级开发到大规模模型训练的全谱系算力需求。 在硬件配置上,GpuGeek采取了差异化策略,不仅提供主流GPU,还针对不同应用场景优化了存储、内存和网络配置。平台支持最高8卡GPU协同工作,并 根据AI算法特性优化了硬件架构,大幅提升了计算效率和稳定性,这些专业化配置成为平台吸引核心用户的重要因素。 四、开放生态建设:构建可持续发展模式 GpuGeek的模型市场汇集了包括阿里通义Qwen3、智谱GLM-Z1等前沿AI模型资源,为用 ...
开源AI开发生态大洗牌:低代码平台逆袭,传统LLM框架日渐式微
量子位· 2025-05-28 07:28
报告+图谱,也让这句"大模型开发生态,是一场现实世界的黑客松",在现场被开发者一遍遍讨论。 是的,在介绍最新的开源生态报告时,蚂蚁开源委员会副主席王旭,就是这么感叹的—— 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 终于!当前的大模型开发生态,被一份报告、完整全景图谱讲清楚了。 就在第十届527蚂蚁技术日上,蚂蚁通过Coding范式、数据、模型部署等角度,对现有开源生态进行了全面完整的大剖析,从数据的视角揭示 了大模型开源生态的演进规律,如果你是大模型开发者或者潜在的开发者, 几乎研究好这份报告可能就够了 。 但这还不够,在报告出炉之前的周末,蚂蚁还发布了2025大模型开源生态全景图,涵盖19个技术领域、135个项目,进一步给出了大模型开 发生态的参考系。 大模型开发生态,是一场现实世界的黑客松。 大模型开源生态,为何是一场实时直播的黑客马拉松? 在去年的QCon(全球软件开发大会)上的报告和量子位的MEET 2025大会中,蚂蚁对开源社区给出了这样的判断: 开源社区的数据可以说既不全面,也不超前于时代,但是,它是跳出公司的一个客观视角。 今年的技术日上,蚂蚁针对开源生态又发布了新的报告,以及新的 ...
Google首席科学家万字演讲回顾AI十年:哪些关键技术决定了今天的大模型格局?
机器人圈· 2025-04-30 09:10
Google 首席科学家Jeff Dean 今年4月于在苏黎世联邦理工学院发表关于人工智能重要趋势的演讲,本次演讲回顾 了奠定现代AI基础的一系列关键技术里程碑,包括神经网络与反向传播、早期大规模训练、硬件加速、开源生 态、架构革命、训练范式、模型效率、推理优化等。算力、数据量、模型规模扩展以及算法和模型架构创新对AI 能力提升的关键作用。 以下是本次演讲 实录 经数字开物团队编译整理 01 AI 正以前所未有的规模和算法进步改变计算范式 Jeff Dean: 今天我将和大家探讨 AI 的重要趋势。我们会回顾:这个领域是如何发展到今天这个模型能力水平的?在当前的技 术水平下,我们能做些什么?以及,我们该如何塑造 AI 的未来发展方向? 这项工作是与 Google 内外的众多同仁共同完成的,所以并非全是我个人的成果,其中许多是合作研究。有些工作 甚至并非由我主导,但我认为它们都非常重要,值得在此与大家分享和探讨。 我们先来看一些观察发现,其中大部分对在座各位而言可能显而易见。首先,我认为最重要的一点是,机器学习 彻底改变了我们对计算机能力的认知和期待。回想十年前,当时的计算机视觉技术尚处初级阶段,计算机几乎谈 ...
你的代码,定义未来!2025第二届英特尔人工智能创新应用大赛火热报名中!
Bei Ke Cai Jing· 2025-04-27 07:09
AI 开发门槛太高,不知如何起步? 2025 第二届英特尔人工智能创新应用大赛已为你备好"破局密钥"!无论你是怀揣技术理想的开发者、 充满奇思妙想的青少年,还是渴望抢占商业先机的企业团队,这场大咖云集的AI盛宴,都将成为你突 破瓶颈、实现价值的起点!百万奖金池、顶级行业资源、前沿技术工具均已就位,只等你加入我们,用 创意点燃AI的无限可能! 开发者们,别让技术门槛绊住脚步!大赛为你量身打造低代码开发利器,无需复杂编程就能轻松搭建 AI应用。哪怕你是新手,也能在OpenVINO、PyTorch等工具的护航下秀出高光时刻!我们还会为你提 供广阔的发展空间。你可以借此体验前沿AI技术,参与项目实践,获得赞助商推广和企业实习机会, 走上属于你的"人生花路"。 青少年朋友们,这里就是你们的创新实验室!零门槛的Web AI技术让你用浏览器就能玩转AI,Coze平 台搭配端云协同技术,使天马行空的灵感秒变现实应用。设计一个智能学习助手帮助同学攻克难题?开 发一款创意工具让艺术与科技碰撞火花?你的种种脑洞,大赛帮你实现!优秀团队不仅能斩获荣誉,还 能直通全国青少年科技大赛、英特尔全球人工智能影响力嘉年华中国赛区决赛等高级别赛 ...
OpenAI前CTO爆炸开局:种子轮开盘20亿美元!0产品0用户估值直奔100亿,GPT论文一作也加入了
量子位· 2025-04-11 06:15
白交 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI前CTO Mira Murati初创公司,正在筹集新融资。 20亿美元(折合人民币146亿),还是 种子轮 ! 消息称一旦融资完成,Thinking Machines Lab估值将达到超100亿美元。 是的,这是一家成立不到一年(距离正式官宣不过两月)、没有任何产品的AI初创公司,现在估值要达到100亿美元了。 甚至几乎可以肯定,20亿美元是目前历史上规模最大的种子轮融资之一。 之所以能融这么多钱,与Mira Murati本身影响力以及背后顶级技术天团不无关系。 而且现在,又有两位大将、昔日战友悄然加盟—— 一个是GPT一作、被奥特曼称作「爱因斯坦级别天才」的Alec Radford;另一位则是前OpenAI首席研究员Bob McGrew。 OpenAI前CTO初创估值将达100亿美元 上个月还在爆料,他们公司正在寻求以90亿美元的估值进行10亿美元的融资。 短短一个月时间,融资金额翻了一倍,估值也有所提升。 去年10月刚传出Mira Murati离职创业时,就已经被曝出说吸金超1亿美元(约合7亿人民币)。 不过融这么多钱到底要干啥,具体细节没 ...