量子位

Search documents
马斯克星舰第九次试飞失败,为测试极限拆除100块隔热瓦,返航途中燃烧解体
量子位· 2025-05-28 02:23
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 马斯克星舰 第九次 飞行测试,二百万网友在线围观。 原本点火、升空一切顺利,完好无损抵达太空,SpaceX员工已经在欢呼庆祝了。 随后却接连发生意外。 首先是部署卫星测试时 舱 门 无法 打开 ,尚不清楚造成这次事故的原因。 随后星舰 在轨 道 失 控 , 发生严重翻滚 。 进入大气层后,几个摄像机位附近剧烈燃烧,先后失去信号。 最后星舰 在59.3千米高空 彻底失 联 。 随后官方确认飞船已 "快速非计划解体" 。 也标志着2025年星舰发射的连续第三次失败。 尽管如此,马斯克本人还是认为有很大进步。 下面来看具体过程。 星舰空中失联解体 本次测试 首次实现超 重型 助推器 的 重复使用 ,所用助推器B14-2曾在第七次飞行测试中完成发射与回收。该助推器原型编号为B14,复 飞时编号更新为B14-2。 助推器B14-2已完成一次性组件更换 (例如烧蚀隔热层) ,其大部分硬件沿用此前经过测试的部件,包括33台猛禽发动机中的29台。 伴随着一声声倒数,第九次飞行测试点火。助推器的 33台猛禽发动机全部成功点火 。 2分30秒,一级助推器、二级飞船 成功 ...
单卡即可微调大模型!内存占用仅1/8,性能依然拉满 | ICML 2025
量子位· 2025-05-28 02:23
GOAT团队 投稿 量子位 | 公众号 QbitAI 诸如Qwen,GPT,DeepSeek R1等基础大模型已成为现代深度学习的基石。 然而,在应用于具体下游任务时,它们庞大的参数规模使得额外微调成本较高。 为了解决这一问题,近期的研究聚焦于 低秩适应 (LoRA) 方法,通过保持基座模型参数冻 结,仅对新增的小型轻量级适配器进行微调,从而降低微调成本。 尽管LoRA具有较高的效率,然而其微调性能往往不及全量微调。 面对这一挑战, 华中科技大学 和 香港中文大学 团队提出了一项全新的LoRA微调框架—— GOAT ,该工作已成功被 ICML 2025 正式接收。 这项研究提出了一套 自适应奇异值初始化 与 混合专家梯度对齐 策略,成功缓解低秩适应 (LoRA)性能不足的难题,在 25 个多领域任务中实现接近甚至超越全参数微调(Full FT)的效果,同时仅需调整极小比例参数。 低秩适应效果不如预期 传统LoRA通过在预训练权重矩阵中添加低秩适配器(如BA矩阵),大幅减少可训练参数 (通常仅需调整0.1%-5%参数),但其性能往往显著落后于全参数微调。 现有方法通常通过随机初始化或者静态奇异值分解(Singu ...
全彩显示的AI眼镜来了!8999元带走阿里大模型和最强光波导
量子位· 2025-05-27 12:31
国补后7649 (原价8999) ,雷鸟正式发布了带有 定制大模型和全彩显示 的AI眼镜——X3 Pro。 雷鸟X3 Pro搭载了4nm高通骁龙AR1平台,支持光波导全彩显示,重量仅为76g。 在AI上,雷鸟延续了之前V3的部署方式,继续与 阿里通义 深度合作,内置了定制化的多模态大模型,可以面对眼前看到的一切,向AI发出提 问。 此外后续还将上线 AI Agent商店 ,可以搜索并安装更丰富的AI应用,还能搭配手机实现眼镜中的实景导航。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 再比如来到新疆赛里木湖,想知道这片湖水中有着什么鱼,AI也能给你解答。 并且依然是不搞长期预售,今日(5月27日)即刻开始预售,6月15日就能发货。 随时随地,用AI探索世界 在之前的V3当中,雷鸟就与通义团队合作打造了专门定制的大模型。 量子位 不久前曾与雷鸟创始人李宏伟先生进行过一次对话 ,其间李宏伟就表示, 定制化大模型是做好AI眼镜的必经之路 。 X3 Pro当中, 雷鸟再次和通义联手 ,开发了专为AR眼镜优化的可视化大模型。 有了X3 Pro,可以边走边问、边吃边问、边聊边问,AI能随时回答你的问题,并且有了 ...
MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench
量子位· 2025-05-27 12:31
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 仅需一个强化学习 (RL) 框架,就能实现 视觉任务大统一 ? 现有RL对推理和感知任务只能二选一,但"大模型六小强"之一 MiniMax 表示:我全都要! 最新开源 V-Triune (视觉三重统一强化学习系统) 框架,使VLM 首次 能够在单个后训练流程中,联合学习和掌握视觉推理和感知任务。 通过 三层组件设计 和 基于动态交并比 (IoU) 的奖励机制,弥补了传统RL方法无法兼顾多重任务的空白。 甚至基于V-Triune,MiniMax还一步到位,贴心地给大家开发了全新的 Orsta (One RL to See Them All) 模型系列 (7B至32B) ,在 MEGA-Bench Core基准测试中从+2.1%显著提升至+14.1%。 值得注意的是,在论文的作者一栏,MiniMax创始人兼CEO 闫俊杰 也参与了这项研究。 目前V-Triune框架和Orsta模型都在GitHub上实现全面开源,点击文末链接即可跳转一键获取。 那话不多说,咱们直接上细节。 推理感知"两手抓" 视觉任务可以分为 推理 和 感知 两类,在当前,RL研究主要集中于数 ...
大厂程序员:AI正在将我们变成高速流水线工人,受不了了
量子位· 2025-05-27 05:58
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 万万没想到, 大厂程序员真要成流水线工人了 。 这不是谁危言耸听,而是亚马逊不少程序员最近的亲身感受—— 很早开始,亚马逊官方就鼓励大伙儿在工作中用AI。 结果发展到今天, "鼓励"更像是一种变相强迫 :高层认为AI能提效,所以不少团队人员直接砍半,项目ddl却大大提前。 搞得不少程序员已经不只是让AI打下手了,为了效率只能让AI直接写程序。 但众所周知,AI编程根本做不到100%正确。 最近,微软著名开源项目.NET Runtime,不就因为新出的Copilot代码Agent尝试帮忙自动修Bug,结果越帮越忙,从而被全球程序员吃瓜嘲 笑么! 亚马逊这边也是,内部工程师用AI写代码,不仅正确率堪忧,还 迫使程序员们变成了"代码审核员",必须得花大量心思去查bug、修bug 。 压根儿不是想象中"用AI解放自己,抽身去做更多高级任务。" 这带来的结果就是,员工表示他们 必须依赖AI才能跟上项目进度,否则绩效就会受到影响,甚至可能被毕业 。 事到如今,亚马逊工程师们的工作更繁杂了,但苦劳是自己的,功劳是AI的,都不知道今后职业晋升之路要怎么走了…… 换谁谁不愁 ...
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
量子位· 2025-05-27 05:58
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 推理大模型开卷新方向,阿里开源 长文本深度思考 模型 QwenLong-L1 ,登上HuggingFace今日热门论文第二。 其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等,取得与Claude-3.7-Sonnet-Thingking相当的性能。 除测评分数外,论文中还详细展示了一个金融文档推理的案例。传统模型容易被无关细节误导,而QwenLong-L1 通过回溯和验证机制过滤干 扰信息,正确整合关键数据 。 任务要求:根据文档回答问题"将优先票据的发行成本与第一年的利息支出合并计算,总资本成本是多少?" 首先出场的基础模型 DeepSeek-R1-Distill-Qwen-14B 被文档中"自2011年10月15日起每半年支付一次利息"误导,根据不相关的时间和财 务信息, 错误计算了第一年的利息支付 。 接下来, 经过额外SFT的版本仍然未能解决这个问题。 它在对不相关文档进行过度分析的循环中自我怀疑,最终尽了最大生成限制(10000 tokens),却没有给出最终答案。 相比之下,虽然QwenLong-L1-14B最 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-27 05:58
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
百度心响上线iOS版,多智能体协作应用终于卷对地方了
量子位· 2025-05-27 03:53
小明 发自 凹非寺 量子位 | 公众号 QbitAI 今年的4月26日, 我们测评了百度新发布的多智能体协作应用心响APP 。当时只上线了安卓版,很多网友在线求苹果版链接。 就在这几天, iOS版也终于上线了 ,只需要在苹果的APP Store搜索关键词即可下载。 现在,苹果安卓用户全部免费用,完全不限量! 在第一时间体验了iOS版心响APP,我们基本上可以下一个判断:智能体应用,终于卷对地方了。 不仅体验门槛低——苹果安卓用户,下载APP就能用, 无需邀请码、每天不限次数 。 而且玩法超全,各类火热的智能体玩法,这一个APP就够用了。 比如定制一个北京游玩攻略,向智能体提出具体的需求,它便能自己拆解任务、调用多个智能体生成对应的方案,甚至四天游玩的路线都基于 地图MCP清晰呈现了出来。 最近智能体真的太火了,各种APP都在接入,让普通人眼花缭乱。 但实际使用还是有很多gap,比如邀请码、用量限额、能力不全面等,导致实际体验受影响。 现在,一个APP,把上述问题都搞定了。 具体体验,来看量子位一手实测。 全能自主的AI搭子 我们具体实测了旅游攻略、深度研究、法律咨询、试题讲解几大场景。 最近很火热的 深度研究 ...
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
量子位· 2025-05-27 03:53
现在,AI完成自动定理证明的表现与挑战究竟如何?主流的技术路径是什么?AI完成形式化 证明的能力,又将对大模型应用带来怎样的影响? 为了回答这些问题, 5月29日20:00 ,我们与2077AI开源基金会共同邀请到了来自 DeepSeek Prover 、 FormalMath 、 Kinima 等项目团队的成员,一同来讨论 大语言模 型形式化证明前沿探索 。 点击下方按钮,一键预约直播 就在5月,前有 DeepSeek Prover V2 发布,后有 陶哲轩的AI数学直播 ,还有谷歌最新发 布的 AlphaEvolve 。 大模型"解数学题"的能力已经是衡量 AI「智能天花板」 的一种方式,正吸引着无数团队争 相挑战。 为了更好地评估AI完成数学推理的能力,近期发布的 FormalMATH基准测试 也备受关注。 林樾 发自 凹非寺 量子位|公众号 QbitAI 也欢迎你加入 量子位每日AI交流群 ,一起来畅聊AI吧~ 一键关注 点亮星标 本周四晚20:00,一起来聊聊 AI数学 吧~ 一键三连 「点赞」「转发」「小心心」 欢迎在评论区留下你的想法! — 完 — 量子位AI主题策划 正在征集中! 欢迎参与专题 ...
扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧
量子位· 2025-05-27 03:53
图1 不同dLLMs使用dLLM–Cache和不使用dLLM–Cache在速度和质量上的对比 dLLM-Cache具有几个重要的亮点: 1. 训练无关,即插即用。 dLLM-Cache完全在推理过程中工作,无需修改模型参数或重训练。dLLM-Cache可以在完全不损失模型输出质量 的前提下,带来最高9.1倍的推理速度提升 。 2. 通用于主流dLLM架构 ,如LLaDA、Dream以及LLaDA-V、MMaDA、Dimple等多模态模型。 EPIC Lab团队 投稿 量子位 | 公众号 QbitAI 首个用于加速 扩散式大语言模型 (diffusion-based Large Language Models, 简称 dLLMs)推理过程的 免训练 方法。 上海交通大学EPIC Lab团队提出了一种 无需训练、即插即用 的高效推理缓存机制: dLLM-Cache 。 其核心思想在于,在一个多步去噪过程中,复用相邻时间步上变化较小的特征,仅更新那些变化较大的特征,从而实现了计算量的大幅降低, 并保持了原有的生成质量。 3. 在推理过程中, 首次识别出 了prompt部分的Transformer中间层特征(Key、 ...