Workflow
量子位
icon
Search documents
高通万卫星:混合AI与分布式协同是未来 | MEET2026
量子位· 2025-12-11 11:37
Core Viewpoint - The evolution of AI applications can be categorized into four stages: Perception AI, Generative AI, Agent AI, and Physical AI [9]. Group 1: Stages of AI Evolution - The first stage, Perception AI, includes traditional technologies such as natural language processing, speech noise reduction, and image recognition, which have been commercialized in many terminal devices for years [13][14]. - The second stage, Generative AI, emerged with the rise of ChatGPT, focusing on pre-training with large datasets and completing specific tasks under human supervision, including text-to-image generation and chatbots [14][19]. - The third stage, Agent AI, allows for autonomous actions, predictions, intent understanding, and task orchestration with minimal human intervention [18][19]. - The fourth stage, Physical AI, is still in the research phase, where AI can understand the physical world and respond according to real physical laws [21][22]. Group 2: Current Industry Trends - The industry is currently transitioning from Generative AI to Agent AI, with a focus on enhancing terminal capabilities from single text modalities to multi-modal interactions [4][19]. - The deployment of large models on terminal devices faces challenges such as memory limitations, bandwidth constraints, and power consumption [6][30][34]. Group 3: Advantages and Challenges of Edge AI - The primary advantage of running large models on terminal devices is personalization, as data generation occurs close to the source, enhancing privacy and security [31]. - Edge AI also offers the benefits of being free and not requiring internet connectivity [32]. - Challenges include memory limitations that restrict model size, bandwidth limitations affecting inference speed, and the need for efficient power management in high-integration devices [34][35][36]. Group 4: Technological Innovations - Qualcomm has developed several technological innovations to address these challenges, including quantization and compression techniques to reduce memory usage, parallel decoding to enhance token generation speed, and advanced NPU architectures for improved performance [37][39][40]. - The parallel decoding technique allows for the generation of multiple tokens simultaneously, improving efficiency and user experience [41][42]. Group 5: Future of AI Experience - The future AI experience is expected to evolve towards a hybrid AI model, where efficient models run on the edge provide personalized services, while larger models in the cloud offer more powerful capabilities [55][57]. - Qualcomm aims to ensure seamless collaboration between edge and cloud environments through low-latency, high-speed, and secure connectivity [58].
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
量子位· 2025-12-11 09:00
正值大模型从"算力堆叠"走向"推理优先"的关键节点, 清华大学智能产业研究院(AIR)创始院长、中国工程院外籍院士张亚勤 提出: 编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 从ChatGPT到DeepSeek,AI正沿着 "智能+" 的路径进入新一轮浪潮。 新一轮人工智能,是信息智能、物理智能和生物智能的融合,本质上也是原子、分子和比特的融合。 也就是说,在规模定律持续发挥作用的前提下,当参数规模、数据体量与算力资源跨过某个阈值,智能就不再只停留在模式识别,而是开 始"涌现"—— 先是从鉴别式AI走向生成式AI,再从生成式AI走向以 智能体 为代表的新范式。 在本次 量子位MEET2026智能未来大会 上,他也将ChatGPT和DeepSeek,视作这一轮演进中的两个重要里程碑: 前者通过统一表征与token化,把文本、语音、图像乃至蛋白质、点云等数据纳入同一空间; 后者则以高效率、高性能、低价格和开源路径,把大模型从"预训练时代"推向以推理为核心的"DeepSeek时刻"。 至于未来5~10年的主战场,在他看来,将走向 "智能体互联网"时代 —— 基础大模型像操作系统一样在全球范围内 ...
量子位编辑作者招聘
量子位· 2025-12-11 06:54
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 参与核心采访,对话产业专家、技术大牛、撰写AI云落地案例。 任职要求: AI财经商业方向 岗位职责: 任职要求: AI产品方向 岗位职责: 任职要求: 站在AI浪潮之巅 :第一时间接触和了解AI领域最新 ...
英伟达GPU被SpaceX送上太空!在天上训练卡帕西的NanoGPT
量子位· 2025-12-11 06:54
人类首次实现了在太空训练、运行大模型。 而主角我们也很熟悉:英伟达、SpaceX、谷歌……还有前OpenAI联合创始人卡帕西的NanoGPT。 几个名字一出,故事就很明确了—— 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI AI真的上天了。 SpaceX火箭把英伟达H100芯片送上太空后,在轨道上运行了谷歌的开源AI大模型Gemma ,并获取到了回应: 你们好,地球人! △ 图源:CNBC 除了Gemma之外,还在H100上用莎士比亚全集训练了卡帕西的大语言模型 NanoGPT 。 对此,网友有话说:以后外星人想研究地球就不用亲自来一趟了(doge)。 首次太空训练AI 上个月初,作为Nvidia Inception一员的、聚焦太空数据中心的初创公司 Starcloud 通过SpaceX火箭将Starcloud-1卫星发射升空,这颗卫 星上搭载了英伟达H100芯片。 并表示在将在2026年10月的下一次卫星发射中携带更多的英伟达H100芯片,并且把Blackwell平台也一并带上去。 现在,就在这颗卫星上,人类实现了首次在太空轨道上训练、运行AI大模型。 在这场太空AI"首秀"中,跑通后的Gemma( ...
纯文本驱动视频编辑,清华&华为&中科大实现无需掩码/参考帧就能精准移除/添加对象
量子位· 2025-12-11 06:54
LoVoRA团队 投稿 量子位 | 公众号 QbitAI 近年来,基于扩散的视频生成模型的最新进展极大地提高了视频编辑的真实感和可控性。然而,文字驱动的视频对象移除添加依然面临巨大挑 战: 不仅需要精准定位目标对象,还要同时保持背景连续性、时序一致性以及语义匹配。 现有大多数方法在推理时必须依赖用户提供的掩码或参考帧来确定编辑区域,这不仅增加了使用门槛,也限制了模型在真实场景中的实用性和 泛化能力。 为了解决上述难题,清华&华为&中科大团队提出 LoVoRA (Learnable Object-aware Localization for Video Object Removal and Addition)——一个真正意义上文本驱动、无需掩码和参考帧的视频对象移除与添加框架。 LoVoRA 能够仅凭文本提示精准定位编辑区域,并进行时序一致、背景自然的视频编辑,无需任何人工掩码或外部控制信号。大量实验和用 户评测表明,LoVoRA 在编辑质量、背景一致性、时序稳定性等指标上均优于现有基线方法。 数据集构建 现有的基于指令的视频编辑数据集,例如InsViE, Ditto, Senoritia, ICVE-SFT等 ...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
量子位· 2025-12-11 06:54
组委会 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek炸翻全场,世界模型开启通向AGI之路,"Agent元年",具身智能全面开花,豆包手机让AI终端热度再上一个台阶…… MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下到场参会观众近1500人,线上直播观众350万+,获得 了主流媒体的广泛关注与报道。 AI世界里原本散落全年的高能节点,在今天,被集中点燃。 在 量子位ME ET202 6 智能 未来大 会 上,这些被全年刷屏的关键词,又一次被工业界、学术界、投资圈的大咖们高频拆解,激情对线。 会场里座无虚席,过道被"站票"填满。台上是学术界和行业内的第一线操盘手,台下是来自大厂、独角兽、科研机构和资本方的长期关注者 们。 屏幕另一头,线上观众在弹幕里叫好不断,一整天都维持在热度高位。 来,跟着量子位碳基编辑一起,把这场大会抛出的关键信号好好捋一捋。 2025年的AI,在发展,在分裂,在重构,迫使所有参与者给未来一个明确站队方向。 今天的MEET2026智能未来大会舞台,把所有力量&分歧&野心&机会同时摆上桌面。 从云到端,从模型到Agent,从软到硬,在这 ...
仿真数据也能Scaling!虚实结合训练,端到端性能全面提升|中科院x港大x小米汽车
量子位· 2025-12-11 01:33
来自香港大学OpenDriveLab、中科院自动化所、小米汽车的联合团队提出了一种解决方案—— SimScale 。 自动驾驶数据荒怎么破? OpenDriveLab 投稿 量子位 | 公众号 QbitAI 该方案 通过真实世界仿真生成关键场景,以及真实仿真协同训练策略,首次揭示了自动驾驶仿真数据的规模效应 。 现实世界难以提供足够的关键与长尾场景,采集到的大多是价值有限的常态片段,导致 数据越多、提升越难 。 因此,自动驾驶的瓶颈不在规模,而在缺乏能系统生成关键场景并支撑大规模训练的新路径。 无需更多真实数据, 只靠扩大仿真数量,一样能持续突破任何端到端驾驶模型的性能上限 。 为什么要有SimScale? 因为让大模型屡创新高的Data Scaling,在自动驾驶场景中失灵了—— 为此,SimScale应运而生。 什么是SimScale? SimScale是一个能"无限扩张世界"的仿真生成框架,通过高保真神经渲染,自动制造多样化反应式交通场景与伪专家示范。 它也是一套让仿真与真实"相互增益"的训练策略,使各种端到端模型都能越训越强,鲁棒性与泛化性全面提升。 它还是一份首次系统揭示自动驾驶仿真规模效益的"实践 ...
Meta公开抄阿里Qwen作业,还闭源了...
量子位· 2025-12-11 01:33
Core Insights - Meta is shifting from an open-source strategy to a closed-source model with the upcoming release of a new AI model codenamed "Avocado" [2][10] - The new model will utilize Alibaba's AI, specifically the Qwen model, during its training process, which has caused significant market reactions [4][6] - This strategic pivot marks a significant departure from Meta's previous commitment to open-source development, indicating a potential failure of its earlier approach [11][15] Group 1: Strategic Shift - Meta's new model "Avocado" is expected to be closed-source, representing a 180-degree turn from its previous open-source narrative [3][11] - The decision to adopt a closed-source model is driven by the need to enhance product capabilities and competitiveness in the AI landscape [14][15] - The reliance on third-party models, including Qwen, for training the closed-source model highlights the complexities of the current AI development ecosystem [13][18] Group 2: Market Reaction - Following the announcement of the new model, Alibaba's stock saw a pre-market increase of 4%, closing with a 2.53% gain, reflecting investor optimism about the collaboration [6] - The market's reaction indicates a recognition of Alibaba's growing influence and success in the AI sector, contrasting with Meta's struggles [9] Group 3: Internal Dynamics - Meta's internal restructuring has intensified following the underperformance of the Llama 4 model, leading to a reduction in open-source discussions and significant layoffs within the FAIR lab [28][30] - The appointment of Alexander Wang as the new Chief AI Officer signifies a shift in leadership and focus towards closed-source AI development [21][32] - The internal conflicts and departures of key figures like Yann LeCun suggest a turbulent transition as Meta navigates its new strategic direction [29][31]
乐奇Rokid这一年,一路狂飙不回头
量子位· 2025-12-10 12:02
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 2025的硬件战场一开局就跑偏到眼镜上,而冲到最前面的,叫 乐奇Rokid 。 据IDC预测,2025年中国智能眼镜出货量预计同比暴涨107%,冲到275万台,手机厂说要重做交互,创业公司跟着一起涌过来,连车企都忍 不住来占个"眼镜位"。 满地都是新品,满眼都是入局者,智能眼镜正从极客玩具变成一门真正的抢手生意,在这场从年初卷到年尾的百镜混战里,有一家创业公司始 终稳稳站在「节奏」的前面。 今年2月, 乐奇Rokid 创始人 祝铭明 一句"发言稿就在我的眼镜里"让乐奇Rokid火爆出圈,之后Rokid Glasses五天售出 4万台 的渠道成 绩、Kickstarter 401万美元 的众筹纪录,像连环重拳一样砸进行业里。 不到一年, 乐奇Rokid 在产品、生态、全球化上的几次关键落子,让智能眼镜这条赛道的节奏和坐标系都悄悄换了版,越来越多厂商开始不 自觉地对齐它的路径。 而 乐奇Rokid 的2025,比这一串数字呈现的故事,更完整,也更耐看。 今年智能眼镜的路子被乐奇Rokid跑明白了 今年看一轮又一轮的智能眼镜新品,会发现行业的重心已经悄悄换了方向 ...
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
量子位· 2025-12-10 10:54
组委会 发自 MEET2026 量子位 | 公众号 QbitAI 刚刚,《2025年度AI十大趋势报告》在 MEET2026智能未来大会 上正式发布。 报告由量子位智库打造,基于对全球AI技术发展、产业应用和社会影响的深度调研与分析,全面呈现了人工智能领域的最新现状与未来发展趋 势。 十大趋势重塑AI发展格局 报告指出,2025年AI正从"工具时代"迈向"伙伴时代",其发展将深刻重塑经济结构、社会形态和人类生活方式,并有十大关键趋势结论: 算力基建化:数据中心需求狂飙,算力经济是智能产业第一大引擎 芯片AI化:AI原生需求重塑芯片创新,大市场大生态打开时代芯机遇 预训练决定大模型格局梯队,架构创新决定预训练水平 大模型落地进入推理时间,推理需求倒逼模型创新 信息AI应用期,物理AI研发期,具身智能成合流风口 AI重塑流量入口:PC互联网、移动互联网、Agentic互联网 多模态成AI应用落地关键:视频、3D、代码依次展现生产力 AI硬件百端齐放:PC手机汽车眼镜玩具,焕脑正当时 AI4S突破加速AGI实现,AI数理化触及博士水平 开源AI进入中国时间,AGI拥有中国路线 报告通过对十大核心趋势的系统梳理,为企 ...