PyTorch - filings, earnings calls, financial reports, news

PyTorch

Search documents

量子位· 2025-07-08 00:40

奕然发自凹非寺量子位 | 公众号 QbitAI 能让非NVIDIA芯片跑CUDA的开源项目ZLUDA，起死回生了。最新版增加了对大模型工作负载的支持，一举登上GitHub热榜！开发者@vosen本名Andrzej Janik，曾经在Intel工作。该项目一度因AMD停止资助濒临破产，最终被一家神秘机构出手相救。现在，创始人vosen带来好消息，表示ZLUDA团队新添一员猛将并稳定进行项目恢复中。在2020年，Andrzej Janik想要尝试一下技术突破，让CUDA程序在非NVIDIA平台运行，一尝试，便有了可行性。之后，ZLUDA被Intel接手，作为一个内部试验项目发展。 Intel分配资源给了ZLUDA，目的很明显了，让其在Intel GPU上跑CUDA程序，作为Intel oneAPI生态的一种补充方式。无疑，这触碰到了NVIDIA的商业生态链。没过多久，这个项目就被终止了。 2022年，ZLUDA得到了AMD的支持而重启，并支持AMD硬件。好景不长，这次也仅仅维持2年，2024年2月宣布终止。过往发展：起起伏伏又起起一个月后，英伟达就发布CUDA 11.6版本，并明确 ...

大佬面对面！斯坦福2025 CS336课程全公开：从零开始搓大模型~

自动驾驶之心· 2025-06-24 11:47

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线从事大模型方向的小伙伴有福利了！斯坦福大学 2025 年春季的 CS336 课程「从头开始创造语言模型（Language Models from Scratch）」相关课程和材料现已在网上全面发布！该课程教职工团队，阵容十分豪华~ 课程视频：https://www.youtube.com/watch? v=SQ3fZ1sAqXI&list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_ 课程主页：https://stanford-cs336.github.io/spring2025/ 讲师Tatsunori Hashimoto：现为斯坦福大学计算机科学系助理教授。其为斯坦福大学 John C. Duchi 和 Percy Liang 的博士后，研究机器学习模型平均性能和最差性能之间的权衡。此前在麻省理工学院攻读研究生，导师是 Tommi Jaakkola 和 David Gifford。本科就读于哈佛大学学习统计学和数学，导师是 Edoardo Airoldi。并且该讲师的研究成果已 ...

从开源共建到生态繁荣：昇思MindSpore支持Day0迁移、一键部署

财联社· 2025-06-12 10:59

1. 迁得快：让三方框架模型 "零成本"迁移，避免重复造轮子，同时模型精度完全对齐。 2 . 部署快：训转推全流程自动化，让大模型部署像执行一行命令一般敏捷高效。 Figure 1 MindSpore生态快速迁移解决方案的技术架构接下来，我们将揭开昇思 MindSpore的破局之道。一、支持训练Day0迁移，构建跨框架的"无感智能翻译"能力当大模型架构日新月异，开发者最怕被生态绑定。昇思 MindSpore通过三重兼容术打通主流技术栈，支持主流加速库模型0代码迁移，通过精度自动对比工具实现跨框架、跨版本、跨策略快速调优，精度对齐原模型，实现在分布式并行策略保持不变的情况下，训练性能提升5 %+ 。在训练生态方面，通过 MindSpeed /Megatron桥接层实现 PyTorch 模型零代码迁移，训练脚本可直接运行；通过动态图能力重构，昇思让 PyTorch 开发者获得"原生体验"，同时借力 MSAdapter 工具自动转换9 5 %以上接口，主流模型如 DeepSeek 、 Pan g u 等迁移损耗逼近于零。大模型发展日新月异，新的大模型层出不穷，参数规模 ...

对话 PyTorch 掌门人 Matt White：AI 应用应该做到“润物细无声”

AI科技大本营· 2025-06-09 10:41

作者 | 王启隆出品丨AI 科技大本营（ID：rgznai100）席卷全球的 AI 淘金热中，一个词正被悄悄地掏空——那就是 "开放" 。近日，PyTorch 基金会执行董事、Linux 基金会 AI 总经理 Matt White 在北京智源大会揭示了一个充满张力的现实：一方面，开源吞噬世界，AI 的开源更形成了一个自我加速的"良性循环"；但另一方面，一场围绕"开放"定义权的无声战争已经打响。这是我们这个时代的十字路口：是任由"开放"沦为一个漂亮的营销词汇，还是为它注入坚实的灵魂？在演讲中，Matt White 带来了两件精心铸造的"武器"：一张名为 "模型开放框架"（MOF）的地图，用清晰的等级标准终结含糊，让真正的开放者得以彰显；以及一本名为 "OpenMDW 许可证" 的护照，专为 AI 模型打造，给予使用者最大限度的自由。他的演讲，与其说是一次技术分享，不如说是一份宣言，一份行动指南。它为我们接下来这场更深入的对话，精准地校对了焦距。在演讲结束后，我们与 Matt White 坐下来，继续探寻这场"为开放而战"的深层动机与未来图景。《新程序员》：嗨 Matt，我们其实和 ...

Artificial Intelligence

Artificial Intelligence

GpuGeek如何成为AI基础设施市场的中坚力量

Jin Tou Wang· 2025-06-04 04:05

二、创新服务模式：重构AI开发体验 AI时代，算力基础设施已成为支撑技术创新和产业升级的关键要素。作为国内专注服务算法工程师群体的智算平台，GpuGeek通过持续创新的服务模式、精准的市场定位和系统化的生态建设，正快速成长为AI基础设施领域的中坚力量。本文将深入分析GpuGeek的成功路径及其在行业中的独特价值。一、精准定位：算法工程师的专属算力平台 GpuGeek敏锐把握市场发展趋势，将目标用户精准定位于对高质量算力有迫切需求的算法工程师群体。这一策略使平台能够深入理解专业用户的核心需求，避免陷入同质化竞争。通过提供从RTX 4090到A800的全系列GPU资源，平台满足了从入门级开发到大规模模型训练的全谱系算力需求。在硬件配置上，GpuGeek采取了差异化策略，不仅提供主流GPU，还针对不同应用场景优化了存储、内存和网络配置。平台支持最高8卡GPU协同工作，并根据AI算法特性优化了硬件架构，大幅提升了计算效率和稳定性，这些专业化配置成为平台吸引核心用户的重要因素。四、开放生态建设：构建可持续发展模式 GpuGeek的模型市场汇集了包括阿里通义Qwen3、智谱GLM-Z1等前沿AI模型资源，为用 ...

AI Infrastructure

RTX 4090到A800的全系列GPU资源

阿里通义Qwen3

智谱GLM - Z1等前沿AI模型资源

预装主流深度学习框架的开发环境（TensorFlow

AI Infrastructure

RTX 4090到A800的全系列GPU资源

阿里通义Qwen3

智谱GLM - Z1等前沿AI模型资源

预装主流深度学习框架的开发环境（TensorFlow

开源AI开发生态大洗牌：低代码平台逆袭，传统LLM框架日渐式微

量子位· 2025-05-28 07:28

报告+图谱，也让这句"大模型开发生态，是一场现实世界的黑客松"，在现场被开发者一遍遍讨论。是的，在介绍最新的开源生态报告时，蚂蚁开源委员会副主席王旭，就是这么感叹的—— 克雷西发自凹非寺量子位 | 公众号 QbitAI 终于！当前的大模型开发生态，被一份报告、完整全景图谱讲清楚了。就在第十届527蚂蚁技术日上，蚂蚁通过Coding范式、数据、模型部署等角度，对现有开源生态进行了全面完整的大剖析，从数据的视角揭示了大模型开源生态的演进规律，如果你是大模型开发者或者潜在的开发者，几乎研究好这份报告可能就够了。但这还不够，在报告出炉之前的周末，蚂蚁还发布了2025大模型开源生态全景图，涵盖19个技术领域、135个项目，进一步给出了大模型开发生态的参考系。大模型开发生态，是一场现实世界的黑客松。大模型开源生态，为何是一场实时直播的黑客马拉松？在去年的QCon（全球软件开发大会）上的报告和量子位的MEET 2025大会中，蚂蚁对开源社区给出了这样的判断：开源社区的数据可以说既不全面，也不超前于时代，但是，它是跳出公司的一个客观视角。今年的技术日上，蚂蚁针对开源生态又发布了新的报告，以及新的 ...

大模型开发生态

AI开源生态

Artificial Intelligence

Artificial Intelligence

Dify

PyTorch

vLLM

Google首席科学家万字演讲回顾AI十年：哪些关键技术决定了今天的大模型格局？

机器人圈· 2025-04-30 09:10

Google 首席科学家Jeff Dean 今年4月于在苏黎世联邦理工学院发表关于人工智能重要趋势的演讲，本次演讲回顾了奠定现代AI基础的一系列关键技术里程碑，包括神经网络与反向传播、早期大规模训练、硬件加速、开源生态、架构革命、训练范式、模型效率、推理优化等。算力、数据量、模型规模扩展以及算法和模型架构创新对AI 能力提升的关键作用。以下是本次演讲实录经数字开物团队编译整理 01 AI 正以前所未有的规模和算法进步改变计算范式 Jeff Dean: 今天我将和大家探讨 AI 的重要趋势。我们会回顾：这个领域是如何发展到今天这个模型能力水平的？在当前的技术水平下，我们能做些什么？以及，我们该如何塑造 AI 的未来发展方向？这项工作是与 Google 内外的众多同仁共同完成的，所以并非全是我个人的成果，其中许多是合作研究。有些工作甚至并非由我主导，但我认为它们都非常重要，值得在此与大家分享和探讨。我们先来看一些观察发现，其中大部分对在座各位而言可能显而易见。首先，我认为最重要的一点是，机器学习彻底改变了我们对计算机能力的认知和期待。回想十年前，当时的计算机视觉技术尚处初级阶段，计算机几乎谈 ...

Artificial Intelligence

Neural Network

Transformer

Self-supervised Learning

Knowledge Distillation

Speculative Decoding

Artificial Intelligence

Neural Network

Transformer

Self-supervised Learning

Knowledge Distillation

Speculative Decoding

你的代码，定义未来！2025第二届英特尔人工智能创新应用大赛火热报名中！

Bei Ke Cai Jing· 2025-04-27 07:09

AI 开发门槛太高，不知如何起步？ 2025 第二届英特尔人工智能创新应用大赛已为你备好"破局密钥"！无论你是怀揣技术理想的开发者、充满奇思妙想的青少年，还是渴望抢占商业先机的企业团队，这场大咖云集的AI盛宴，都将成为你突破瓶颈、实现价值的起点！百万奖金池、顶级行业资源、前沿技术工具均已就位，只等你加入我们，用创意点燃AI的无限可能！开发者们，别让技术门槛绊住脚步！大赛为你量身打造低代码开发利器，无需复杂编程就能轻松搭建 AI应用。哪怕你是新手，也能在OpenVINO、PyTorch等工具的护航下秀出高光时刻！我们还会为你提供广阔的发展空间。你可以借此体验前沿AI技术，参与项目实践，获得赞助商推广和企业实习机会，走上属于你的"人生花路"。青少年朋友们，这里就是你们的创新实验室！零门槛的Web AI技术让你用浏览器就能玩转AI，Coze平台搭配端云协同技术，使天马行空的灵感秒变现实应用。设计一个智能学习助手帮助同学攻克难题？开发一款创意工具让艺术与科技碰撞火花？你的种种脑洞，大赛帮你实现！优秀团队不仅能斩获荣誉，还能直通全国青少年科技大赛、英特尔全球人工智能影响力嘉年华中国赛区决赛等高级别赛 ...

OpenAI前CTO爆炸开局：种子轮开盘20亿美元！0产品0用户估值直奔100亿，GPT论文一作也加入了

量子位· 2025-04-11 06:15

白交发自凹非寺量子位 | 公众号 QbitAI OpenAI前CTO Mira Murati初创公司，正在筹集新融资。 20亿美元（折合人民币146亿），还是种子轮！消息称一旦融资完成，Thinking Machines Lab估值将达到超100亿美元。是的，这是一家成立不到一年（距离正式官宣不过两月）、没有任何产品的AI初创公司，现在估值要达到100亿美元了。甚至几乎可以肯定，20亿美元是目前历史上规模最大的种子轮融资之一。之所以能融这么多钱，与Mira Murati本身影响力以及背后顶级技术天团不无关系。而且现在，又有两位大将、昔日战友悄然加盟—— 一个是GPT一作、被奥特曼称作「爱因斯坦级别天才」的Alec Radford；另一位则是前OpenAI首席研究员Bob McGrew。 OpenAI前CTO初创估值将达100亿美元上个月还在爆料，他们公司正在寻求以90亿美元的估值进行10亿美元的融资。短短一个月时间，融资金额翻了一倍，估值也有所提升。去年10月刚传出Mira Murati离职创业时，就已经被曝出说吸金超1亿美元（约合7亿人民币）。不过融这么多钱到底要干啥，具体细节没 ...

Artificial Intelligence

Artificial Intelligence