量子位
Search documents
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
量子位· 2025-12-14 07:12
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 不鸣则已,一鸣惊人。 没想到一个低调霸榜了 全球最权威SQL榜单 超过两个月的 国产AI ,这一次选择了高调 开源 。 开源旗下数据智能体关键技术—— Agentar-SQL系列 。 此次开源不仅包含实时文本转SQL(Text-to-SQL)框架的全套论文、代码、模型和使用指南,后期还将陆续开源数据库理解与挖掘、行业 知识挖掘、实时多轮交互技术框架,覆盖意图理解、业务理解到数据理解的全链路数据能力。 如果你关注AI数据分析领域,大概率听说过 BIRD-Bench 。这是目前全球公认最具权威性的NL2SQL评测基准。 就在今年9月,蚂蚁数科的Agentar-Scale-SQL在BIRD榜单上以 执行准确率(81.67%)和执行效率(77%) ,双料第一的成绩登顶一举 超越了谷歌、亚马逊等国际科技巨头。 | | Model | Code | Size | Oracle | Dev | Test | | --- | --- | --- | --- | --- | --- | --- | | | | | | Knowledge | (%) | (%) | | | ...
量子位编辑作者招聘
量子位· 2025-12-14 07:12
以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
统一视觉多模态与多任务!快手可灵与港科大团队发布视频生成模型,加速真实世界理解
量子位· 2025-12-14 07:12
它通过统一训练多种视觉模态 (如深度图、光流、骨骼、分割掩码等) ,让模型更懂物理世界规律,生成的视频更真实、更可控。 不仅模型生成质量更高,它还实现了 零样本泛化 ,对于从未见过的物体或场景,也能生成合理结果。 下面是更多详细内容。 允中 整理自 凹非寺 量子位 | 公众号 QbitAI 不仅能"听懂"物体的颜色纹理,还能"理解"深度图、人体姿态、运动轨迹…… 统一多模态多任务的视频生成模型来了。 来自港科大、港中文、清华大学和快手可灵的研究团队,最近提出了一个全新视觉框架—— UnityVideo 。 从文本大模型到视觉大模型 当回顾大语言模型 (LLMs) 的发展历程时,会发现一个有趣的现象: GPT、Claude等模型之所以拥有强大的泛化和推理能力,很大程度上得益于它们统一训练了多种文本子模态——自然语言、代码、数学表达 式等。 这种多模态统一训练使模型能够在不同领域之间进行知识迁移,从而涌现出惊人的推理能力。 那么,视觉领域是否也存在同样的机会? 现有的视频生成模型虽然在合成质量上取得了令人瞩目的进步,但大多数模型仍然局限于单一的RGB视频学习——就像只用纯文本训练语言 模型一样,这限制了模型对物理 ...
OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE
量子位· 2025-12-14 05:17
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 破解AI胡说八道的关键,居然是给大模型砍断99.9%的连接线? 也就是 Circuit Sparsity 技术的开源实现。 这是一种通过人为约束模型内部连接的稀疏性,让模型计算过程可拆解、可理解的大语言模型变体,本质上是为了解决传统稠密Transformer 的黑箱问题,让内部的计算电路能被人类清晰解读,知道AI是如何做决策的,避免轻易相信AI的胡话(doge)。 OpenAI悄悄开源新模型,仅有0.4B参数,且99.9%的权重为零。 更有人直言这种「极致稀疏+功能解耦」的思路可能会让当下热门的MoE(混合专家模型)走上末路。 那么,当Transformer的权重被训练到近乎全0,会发生什么呢? 放弃粗糙近似,追求原生稀疏 先说说为啥这个模型的思考过程能像电路图一样好懂。 咱们平时用的传统大模型,内部神经元连接得密密麻麻,权重矩阵几乎全为非零值,信息传递呈现出高度叠加状态,就像一团扯不开的乱线, 没人能说清它是怎么得出某个结论的。 这些留存的非零权重连接就像电路图里的导线,信息只能沿着固定路径传递;同时,模型还会通过 均值屏蔽 剪枝方法,为每个任务拆出专属 ...
为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026
量子位· 2025-12-13 08:30
Core Insights - The next stage of artificial intelligence (AI) development requires overcoming two major challenges: the Transformer architecture and the backpropagation algorithm [1][7][54] - The focus should shift from larger models to creating "living" models that possess native memory, autonomous learning, and continuous evolution capabilities [2][4][48] - This transition signifies a move from centralized cloud computing to decentralized learning, where each device can contribute to knowledge generation [3][5][70] Group 1: Hardware Awakening - The concept of "hardware awakening" suggests that devices can learn and adapt in real-time, transforming them from mere tools into active intelligent agents [4][64] - A multitude of such intelligent agents collaborating in the real world can lead to the emergence of collective intelligence [5][71] - The current reliance on the Transformer model limits the potential for true intelligence, as it does not facilitate autonomous learning or native memory [21][30][76] Group 2: Redefining Value - The future of AI will redefine the value of hardware, moving beyond traditional metrics like memory and processing power to focus on the co-creation of value between users and devices [64][66] - Users should pay for intelligence rather than token consumption, as the latter is seen as an inefficient model [15][19][21] - The emergence of devices with autonomous learning capabilities will enhance user experience and privacy, as data remains localized [68][69] Group 3: Collective Intelligence - Collective intelligence arises when each device possesses its own intelligence and can learn from the physical world, similar to human collaboration [71][76] - True intelligence is characterized by the ability to generate knowledge rather than merely disseminating it, which is a limitation of current large models [75][77] - The path to general artificial intelligence is through collective intelligence rather than the centralized model exemplified by companies like OpenAI [77]
太初元碁乔梁:AI算法已经跑到单芯片极限|MEET2026
量子位· 2025-12-13 06:30
随着AI技术不断发展落地,行业应用对于算力的需求与日俱增,这已经成为广泛共识。 编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 与此同时,算法本身的规模和复杂度也在成倍增长,让整个行业正式迈入一个更高强度的算力周期,对此 太初元碁联合创始人兼首席运营官 乔梁 表示: 当下行业应用对于算力的需求与日俱增,AI需要算法实现毫秒级精确度,而这恰好带动算力需求呈指数级增长。 这意味着,在未来的技术演进中,高性能计算将贯穿生产制造、科学研究到AI落地的全链路,成为各类计算场景的底层支撑力量。 在本次 量子位MEET2026智能未来大会 上,乔梁围绕超智融合、异构融合等关键词分享了自己对国产算力生态建设的看法: 目前,各类AI大模型、不同领域的AI Agent落地都需要大量算力来支撑,在这一背景下,"超智融合发展"已成为行业共识。 无论是AI算法的迭代,还是传统科学计算的发展,未来的趋势都会指向同一件事:在通用计算的场景下,通过硬件架构的设计来实现异构融 合。 为了完整体现乔梁的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。 MEET2026智能未来大会是由量子位 ...
量子位编辑作者招聘
量子位· 2025-12-13 04:34
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 跟进AI基建层新进展,包括但不限于芯片、AI Infra、云计算领域新进展,核心玩家动态; 做前沿论文、开源社区、技术大会 (Hot Chips、NeurIPS、MLSys) 技术报告大众化解读; 参与 ...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS'25
量子位· 2025-12-13 04:34
△ 卫星星座任务规划效果展示 卫星星座是由多颗卫星组成的协同网络,具备远超单星的全球覆盖、快速响应和高频观测能力。从美国的巨型卫星通信星座到我国的"千帆"星 座, 卫星星座已从科幻概念走向产业核心,成为数字经济时代的基础设施。 这些运行在距地数百公里的卫星星座,正默默支撑着遥感、通信、导航、气象预测等关键行业。但每一个稳定运行的星座背后,都藏着一个高 维、动态、强约束的规划难题。 如何在短短几分钟的观测窗口内,调度数十颗卫星形成协同观测网络,执行上百项任务,同时响应地震救 援、海上搜救、森林火灾等突发需求? 人工智能技术正在成为破解这一难题的关键钥匙。北航刘偲教授团队提出 首个大规模真实星座调度基 准AEOS-Bench ,更创新性地将Transformer模型的泛化能力与航天工程的专业需求深度融合,训练 内嵌时间约束的调度模型AEOS- Former 。这一组合为未来的"AI星座规划"奠定了新的技术基准。 AEOS-Bench&AEOS-Former团队 投稿 量子位 | 公众号 QbitAI 将卫星星座送入轨道我们都知道很难,但高效规划调度在轨卫星星座执行任务也不简单。 随着部署的星座规模越来越大,通过人 ...
美国视频生成老炮儿,入局世界模型
量子位· 2025-12-13 04:34
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 世界模型赛道,又有老面孔新鲜入局! 就在刚刚,Runway发布旗下首个通用世界模型 GWM-1 。 不止于此,还打包发布了一系列世界模型变体: 而这些通通都是基于最新版 Gen-4.5 建立的。 是的!Runway这次还把Gen-4.5来了个大升级。 模拟真实环境的GWM Worlds; 模拟人物对话的GWM Avatars; 模拟机器人操作的GWM Robotics。 …… 看来年末大促销的不只有圣诞老人奥特曼,还有好莱坞名导Runway。 话不多说,上实机: 世界模型全家桶发布 根据官方介绍,GWM-1是基于Gen-4.5构建的,这是Runway最新的视频生成模型。 但和Gen-4.5有所不同的是,GWM-1采用的是 自回归 架构,它可以根据之前的记忆内容,进行逐帧预测生成。 另外模型支持实时交互控制,包括调整相机姿态、修改机器人操作指令或音频。 它目前包含三个变体: 1、GWM Worlds:用于实时环境的模拟与探索。 GWM Worlds能够让用户在连贯、有反应的世界中自由移动,而无需手动设计每个空间。 具体来说,用户首先需要为模型提供一个可供参考 ...
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
量子位· 2025-12-13 04:34
西风 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,陶哲轩与多名数学家通力合作,为Erdős #1026正式画上了句号 。 至此,这个尘封50年的难题终于得到完全解决。 关键是,AI又立大功了。在多种AI工具的辅助下,整个解题流程仅用 48小时 便完成。 博采众家&AI之长,正在成为解决问题的关键。 正如陶哲轩本人所说: 用传统方法,一两位数学家用简单的编程和文献检索工具,最终也能完成, 但可能需要数周或者数月才能解决 。 陶哲轩随后亲自梳理并公开了此次问题被解决的完整过程。 消息传出后,网友纷纷感叹"太酷了": 一起来看看他们究竟是如何解决的? 48小时解决Erdős #1026 Erdős #1026 问题最早在1975年被提出,初始问题为: 但该问题表述相当模糊,于是数学家Desmond Weisenberg提议对这个函数的最小可能值进行研究,引入一个最大常数的量c(n),使得: $$S(x_{1},\ldots,x_{n})\geq c(n)\sum_{i=1}^{n}x_{i}$$ 其中c(n)是所有长度为n的不同实数序列。 如果用 博弈论 来解释该问题,那么就是: 假设Alice有N ...