Workflow
量子位
icon
Search documents
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-19 04:37
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 获得专业指导 :会由主编级编辑出任men ...
参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA
量子位· 2025-05-19 04:37
PointKAN团队 投稿 量子位 | 公众号 QbitAI 新架构选择用KAN做3D感知,点云分析有了新SOTA! 来自 哈尔滨工业大学(深圳) 和 宾夕法尼亚大学 的联合团队最近推出了一种基于Kolmogorov-Arnold Networks (KANs) 的3D感知解决方 案—— PointKAN ,在处理点云数据的下游任务上展现出巨大的潜力。 △ PointKAN与同类产品的比较 替代传统的MLP方案,PointKAN具有更强的学习复杂几何特征的能力。 此外团队还提出 PointKAN-elite 版本,使用 Efficient-KANs 结构,在保持准确率的同时显著降低参数量。 PointKAN框架解析 PointKAN的整体流程如下图所示。 以下是更多详细内容介绍。 为什么要选择KANs 当前多层感知机 (MLPs) 凭借其高效的特征学习机制,已成为点云分析的基础架构组件。 然而在处理点云复杂几何结构时,MLP的固定激活函数难以有效捕捉局部几何特征,同时存在参数量冗余大、模型效率低下的问题。 而KANs是以Kolmogorov-Arnold表示定理 (KART) 作为数学依据的一种新颖的神经网络 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-18 05:20
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 获得专业指导 :会由主编级编辑出任mentor,提供一对一指导,帮你更快进步获得 成长。 加入活力团队 :与一群志同道合的年轻人一起工作,享受扁平、简单、开放、充满 活力的团队氛围。 获得丰厚回报 :具有竞争力的薪资待遇(8K-20K),五险一金、餐补、项目绩 效、商务绩效、加班补助等福利一应俱全。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 ...
经典教材《泛函分析》作者逝世,享年99岁:首位获阿贝尔奖的应用数学家
量子位· 2025-05-18 05:20
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 史上首位获得阿贝尔奖(数学界诺奖)的应用数学家 Peter Lax (彼得·拉克斯)逝世了,享年 99岁 。 或许你对这个名字不太熟悉,但你很可能学过他编写的那个经典教材—— 《泛函分析》 。 纵观他的一生,拉克斯可以说是站在理论数学和应用数学 交叉点 的巨匠。 同时,他也是 最早将计算机技术应用于数学分析的先驱之一 。 拉克斯所提出的众多经典理论和方法,至今仍然广泛地应用于科学研究和工程实践中。 不仅如此,除了那本耳熟能详的《泛函分析》之外,他所编写的很多教材也被莘莘学子们所青睐。 包括 《微积分及其应用》 、 《线性代数及其应用》 等等。 用网友的话来评价就是: 能把分析的知识写的像给大众的科普读物一样,也就是数学大师的功力了。 值得一提的是,今年5月1日拉克斯刚刚过完他99岁的生日,阿贝尔奖官方亲自发文祝贺,并给予了这样的评价: 拉克斯在将纯数学和应用数学结合在一起方面表现突出。 他的影响深远,不仅体现在他的研究,还体现在他的著作、他对教育的终身承诺以及他对年轻数学家的慷慨。 对此,《纽约时报》在讣告中评价他为"重新定义了数学在计算机时代的角色",而 ...
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
量子位· 2025-05-18 05:20
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 天下苦大模型 矩阵乘法 久矣。 毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。 那么就没有一种更"快、好、省"的方法来搞这事儿吗? 有的, 香港中文大学 最新一篇仅 10页 的论文,便提出了一种新算法: 论文作者之一的Dmitry Rybin表示: 这项研究对数据分析、芯片设计、无线通信和LLM训练都有着深远的影响! 能源可节省:5%-10% 时间可节省:5% 这么算矩阵乘法,更快! 矩阵乘法是计算机科学和数值线性代数中的核心问题之一。 自从Strassen和Winograd的开创性工作以来,研究者们一直在探索如何减少矩阵乘法所需的计算量。 尽管这类运算在统计、数据分析、深度学习和无线通信等领域有着广泛应用,例如协方差矩阵的计算和线性回归中的关键步骤,但对于具有 特殊结构的矩阵乘法(如计算矩阵与其转置的乘积XX t )的研究相对较少。 从理论角度看,计算XX t 与一般矩阵乘法具有相同的渐近复杂度,因此只能通过常数因子优化来提升速度。 因此,这篇论文《XX t Can Be Faster》提出了一种名为RXTX的新 ...
翁荔最新万字长文:Why We Think
量子位· 2025-05-18 05:20
网友们看罢,纷纷打出了 "精彩" 二字: 感觉就像打开了人工智能理解的一个全新维度。 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 《Why We Think》。 这就是北大校友、前OpenAI华人VP 翁荔 所发布的最新 万字长文 —— 围绕"测试时计算"(Test-time Compute)和"思维链"(Chain-of-Thought,CoT),讨论了如何通过这些技术显著提升模型性能。 翁荔表示: 让模型在输出答案前多思考一会儿(比如通过智能解码、思维链推理、潜在思考等方法),能显著提升它的智能水平,突破当前的能 力瓶颈。 那么接下来,我们就来深入了解一下这篇文章。 动机 让模型思考更长的时间可以通过几种不同的方式来激发。 心理学类比 核心思想与人类思考方式深度关联。 人类无法立即回答"12345×56789等于多少?",而是需要时间分析——这正是Daniel Kahneman在《思考,快与慢》(2013)中提出的双 系统理论: 因为系统1思维是快速和简单的,它经常以准确性和逻辑性为代价,成为主要的决策驱动因素。它自然依赖于我们大脑的思维捷径(即启发 式),并可能导致错误和偏见。 通过有意识地放 ...
打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”
量子位· 2025-05-18 02:01
一水 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 数学能力几乎和AlphaGo的围棋水平一样?! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了 「通用科学人工智能」 AlphaEvolve ,直接打破了矩阵乘法领域56年以来的效率基准。 一位谷歌前员工更是将这一成就类比为传说中的"神之一手": 太疯狂了!AlphaEvolve的数学能力相当于AlphaGo打败人类的"神之一手"第37步。 具体而言, 4x4矩阵乘法 的 49 次标量乘法效率基准已经持续56年,而AlphaEvolve直接将这个数字改写为 48 。 别看数字只前进了一小步,但背后所代表的 更快的矩阵乘法算法 可谓意义重大。 不仅可以解决复杂数学难题,还能用来改进芯片设计、提高数据中心和AI训练的效率。 在谷歌内部使用中,它将Gemini架构中大型矩阵乘法运算加速了23%,从而将Gemini的训练时间缩短了1%,并且还将FlashAttention提速了 32.5%。 那么接下来的问题是—— AlphaEvolve是如何做到的?背后藏着哪些核心技术原理? 在AlphaE ...
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
量子位· 2025-05-17 03:50
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 强化学习(RL)+真实搜索引擎,可以有效提升大模型检索-推理能力。 但问题来了: 一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。 另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。 现在,来自阿里通义实验室的解决方案公开了:开源 ZeroSearch ,提供了一种 无需与真实搜索引擎交互 的强化学习框架。 实验表明,ZeroSearch仅需3B参数的LLM作为检索模块,即可有效提升搜索能力,节省了高昂API成本。 ZeroSearch让LLM"自给自足"实现搜索进化 研究团队用 模拟搜索环境+渐进式抗噪训练 ,让LLM不再依赖昂贵搜索引擎API。 轻量微调:把LLM变成"搜索引擎模拟器" 用少量标注数据微调LLM,使其能按指令生成两种文档—— 有用结果 和 噪声干扰 。 通过收集与真实搜索引擎交互的数据,ZeroSearch对LLM进行轻量级监督微调。 在这个过程中,模型学会生成与真实搜索引擎风格相似的文档,同时能够根据提示词生成相关或噪声文档。 这种能力使得模型在训练过程中能够动态调整文档质量,从而更好地模 ...
OpenAI:GPT-5就是All in One,集成各种产品
量子位· 2025-05-17 03:50
一水 发自 凹非寺 量子位 | 公众号 QbitAI GPT-5将会集大成于一体?! 就在发布"最强编程智能体Codex"之后 ,OpenAI又接着在Reddit举行了 "有问必答"活动 。 公司研究副总裁Jerry Tworek,剧透了下一代基础模型GPT-5的最新消息: 为了减少模型切换,未来计划将Codex、Operator、Deep Research和Memory整合在一起 。 Q3 : 团队在使用Codex时,发现了哪些与目前的"氛围编码(vibe coding)"不同的范式转变?开发这个工具的灵感是什么? 除此之外,其他Codex团队成员也纷纷开启了爆料模式,比如: Okk,下面我们一起吃瓜。 回应10大重点问题 Codex最初只是一个附带项目,启动原因是他们意识到在内部工作流中未充分利用好模型; 内部在使用Codex时,编程效率提升了约3倍; OpenAI正在探索灵活的定价方案,包括按需付费; o3-pro或codex-1-pro最终将在团队能力允许的情况下推出; …… 整体而言,OpenAI团队这次主要分享了Codex的详细情况,以及公司未来的发展计划。 为了尽量贴合问答者原意,我们直接以对话 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-17 03:50
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...