量子位

Search documents
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-23 06:14
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 具身智能机器人方向编辑作者 终端硬件方向编辑作者 AI新媒体编辑(微博/小红书方向) 紧跟AI浪潮 :密切关注AI、大 ...
预测误差仅0.26mm,中科院自动化所×灵宝CASBOT团队让机器人提前“知道你要干嘛”
量子位· 2025-05-23 06:14
以下文章来源于灵宝CASBOT ,作者灵宝CASBOT 灵宝CASBOT . Shaping Future Robotics. 灵宝CASBOT团队 投稿 量子位 | 公众号 QbitAI 在人与机器人愈发紧密协作的时代,如何让机器人"读懂"人类的意图、与人类默契配合,成为 智能技术发展的关键一步。 近日,由 中国科学院自动化研究所 与 灵宝CASBOT 共同提出的关于" 增强物理人机协作中 的人类意图估计和人机角色分配 "方法(DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration)获ICRA 2025录用。 | 16:40-16:45, Paper ThET11.2 Add to My Program _ | | --- | | DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration | | Liu, Haotian Inst ...
超长推理还能节省计算!Salesforce开源神器两连发:教大模型边想边省,显著提升数学编程准确率
量子位· 2025-05-23 06:14
Salesforce团队 投稿 量子位 | 公众号 QbitAI 推理大模型如何提升效率?Salesforce AI Research开源神器两连发—— Elastic Reasoning 和 Fractured Sampling 。 Elastic Reasoning用"想多少、答多少"替代了"想到哪算哪",让模型在预算范围内思考更合理,输出缩短30%,同时保持(甚至提高)了准 确性。 Fractured Sampling让模型"少想早答",重新定义了思维链推理的成本-性能前沿,使LLM能够在更低的计算开销下实现强大的推理。 这两种方案显著提高了数学和编程任务的准确率,在推理预算紧张时依然表现出色。 Elastic Reasoning:首次实现"思考-解题"分开管预算 当前的推理大模型在处理任务时往往需要生成长的Chain-of-Thought(CoT)推理链,效果虽好,但开销很大。 在预算有限的情况下,Elastic Reasoning提出了一种新的"思考分段法":把推理流程显式划分为 思考部分 和 解题部分 ,为它们分别分配 token预算。 通俗地讲,让大模型每次生成时,不再一股脑"想到哪说到哪",而 ...
四位图灵奖掌舵,2025智源大会揭示AI进化新路径
量子位· 2025-05-23 06:14
中国,北京 允中 发自 凹非寺 量子位 | 公众号 QbitAI 2025年6月6-7日 6月6日,关于深度学习和强化学习的探讨,将在2025智源大会继续开展,如"双星交汇"般 的时空对话,总结过往、共探智能之谜的终极答案。 与此同时,推理大模型的兴起、开源生态的加速、具身智能的百花齐放,成为2025年AI发展 的关键词。DeepSeek掀起新的开源热潮,VLA等开源模型推动具身智能迅速演进,创新企 业不断涌现,构建起多元而活跃的AI产业生态。 第七届北京智源大会 将于2025年 6月6日至7日 在中关村国家自主创新示范区展示中心举 行。作为人工智能领域的顶级学术峰会,大会汇聚全球顶尖研究者,分享最新成果、洞察关 键趋势。自2019年创办以来,已有12位图灵奖得主参与,每年吸引200余位专家参会,联动 全球30多个国家和地区的50万从业者,被誉为"AI内行春晚"。 今年论坛,智源大会将围绕人工智能 基础理论、应用探索、产业创新、可持续发展 四大主 题,设立近20场专题论坛,涵盖 深度推理模型、多模态模型、具身智能与人形机器人、自 主智能体、下一代AI路径探索、脑启发、AI for Science (AI4S) ...
巧妙!一个传统技术让国产视觉基础模型直接上大分
量子位· 2025-05-23 06:14
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 咱就是说啊, 视觉基础模型 这块儿,国产AI真就是上了个大分—— Glint-MVT ,来自格灵深瞳的最新成果。 先来看下成绩—— 线性探测 (LinearProbing): 简单来说,线性探测是一种测试预训练模型效果的小技巧,测的就是基本功扎不扎实。它的做法是: 把模型最后一部分换成简单的线性层,其他部分全部保持原样不动;然后只训练这个新加的线性层,通过它的表现来判断模型之前学到的特 征好不好用。 再来看应用效果。 如果说视觉基础模型是一个底座,那么它的下游任务,像 "图像理解+分割一切" ,便是更为直观的效果展现。 例如下面这张图片,然后我们可以问一下AI: 你能提供一个分割掩膜给这个图像中触摸篮球的人吗? 很显然,这个任务的难点在于拿篮球的人被其他人的手、身体等部位挡住,分割难度也大幅增加。 然而,国产AI是不在怕的,啪的一下,超精细地把要求的人物给抠了出来: 我们再来看下更加复杂的案例: 这个测试是在26个分类测试集中跟CLIP和OpenCLIP做了对比,结果显示,国产视觉基础模型平均准确率比OpenCLIP高2.3%,比CLIP高 1.1%。 面 ...
首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源
量子位· 2025-05-23 00:24
这是首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,由此来测评大模型是否符合大规模应用的标 准。 目前, TransBench评测方法与数据集已全面开源 ,也已发布了首期测评结果。 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI AI替咱打工搞翻译,到底谁家最好用? 终于,有人来统一翻译江湖的标准了: 首个应用型AI翻译测评榜单TransBench在OpenCompass上线 。 它由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布。 与传统的翻译测评体系相比,TransBench 增加了幻觉率、文化禁忌词、敬语规范等指标 ,专门针对大模型翻译最容易出错的关键问题进行 实战考核。 比如: 欢迎各个AI翻译机构去打榜,一较高下~ GPT-4o稳坐"翻译AI天花板" 官网表示,TransBench数据集中涵盖中、英、法、日、韩、西班牙等多种语言。 此外,还在不断持续更新海量小语种。 TransBench评测体系中的数据集,根据"通用标准""电商文化""文化特性"三个大类,整理了不同的数据集。 目前,TransBench多语言翻译评测榜单首期已经出 ...
最强编码模型Claude 4!7小时不间断写代码,连玩24小时宝可梦,GitHub已选为Copilot底层模型
量子位· 2025-05-23 00:24
白交 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI AI圈子好热闹。今天凌晨,Claude终于迎来了它的重大版本升级—— Claude 4来了! 此次主要发布的有两个模型: Claude Opus 4 和 Claude Sonnet 4 。 一经面世,就在编码、高级推理和AI Agent重新定义了新的标准,直接实现SOTA。 GitHub已经宣布,将使用Claude Sonnet 4作为 GitHub Copilot新编码Agent的基础模型 。 单这一个例子,就能看出它非常强的持久工作能力,以及上下文理解能力。 看遍评论区,发现使用过Claude 4几乎都给予了它高度评价,尤其是对Opus 4 (不愧是旗舰模型哇) 。 有人说,"Opus 4是我用上的第一个不用自己动手改,就生成高质量内容的第一个大模型"。 而两个模型里最为人所津津乐道的是旗舰模型Claude Opus 4,它最引人注目的就是持续的干活,一身用不完的牛劲。 比如,它可以在连续24小时畅玩宝可梦,而之前版本Claude 3.7 Sonnet只能连续玩 45 分钟。 其客户之一,日本乐天集团 (Rakuten) 使用Claude Opu ...
雷军发布小米自研3nm芯片系列新品:首搭手机平板和手表,基带模块也亮相了
量子位· 2025-05-23 00:24
克雷西 西风 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,小米 自研SoC芯片玄戒O1 终于揭开神秘面纱! 采用最先进的 第二代 3nm制 程 ,能效表现位列第一梯队—— 发布全程,雷军都在将这块芯片与苹果最先进手机芯片做对标。 玄戒O1 采用双超大核设计,CPU多核性能跑分超越苹果A18 Pro,GPU曼哈顿帧率更是比A18 Pro提升了43%。 与此同时,搭载玄戒O1的小米15S Pro手机也同步发售,16+512GB售价5499。 雷军官宣玄戒O1采用的是3nm制程之时,关键词"3nm"一度登上热搜榜首,连续在榜时间达到了近9个小时。 今天,与小米相关的话题占据了多个热搜词条,"小米发布会"也曾登上首位。 多项指标超越苹果A18 Pro 作为小米首款自主研发的SoC,玄戒O1采用了当前最先进的第二代3nm制程,在109mm²的空间内堆下了190亿颗晶体管。 核心方面,玄戒O1采用了10核4Cluster架构,与苹果一样采取了双超大核结构,包含了两颗Arm最新的X95超大核。 先看综合成绩,玄戒O1芯片的安兔兔实验室综合跑分已经超过了300万,位列第一梯队。 超大核主频达到了3.9GHz,拥有2 ...
字节开源高精度文档解析大模型Dolphin:轻量高效,性能超GPT4.1、Mistral-OCR!
量子位· 2025-05-22 14:29
字节跳动刚刚开源一款全新文档解析模型—— Dolphin 。 与目前市面上各类大模型相比,这款轻量级模型不仅体积小、速度快,并且取得了令人惊艳的性能突破, 解析效率提升近2倍 。 Dolphin团队 投稿 量子位 | 公众号 QbitAI 测试结果显示,Dolphin在文档解析任务上解析准确率超越了 GPT-4.1、Claude3.5-Sonnet、Gemini2.5-pro、Qwen2.5-VL 等通用多 模态大模型,以及最近推出的号称最强OCR大模型的 Mistral-OCR 等垂类大模型。 论文已被收录于ACL 2025,项目链接可见文末。 突破性的两阶段解析方法 文档图像解析解决方案可以分为两大流派:集成式方法以及端到端方法。 集成式方法在链路中组装多个专家模型,端到端方法则利用视觉语言模型通过自回归解码直接生成结构化结果。 而Dolphin采用了全新的 "先解析结构后解析内容"(analyze-then-parse) 两阶段范式: 这种创新架构一箭双雕,既避免了传统商用方案中多OCR专家模型级联带来的错误累积问题,又克服了通用多模态大模型易丢失版面结构 信息、自回归解码效率低的痛点。 因为获取孤立的 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-22 14:29
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 获得专业指导 :会由主编级编辑出任mentor,提供一对一指导,帮你更快进步获得 成长。 加入活力团队 :与一群志同道合的年轻人一起工作,享受扁平、简单、开放、充满 活力的团队氛围。 获得丰厚回报 :具有竞争力的薪资待遇(8K-20K),五险一金、餐补、项目绩 效、商务绩效、加班补助等福利一应俱全。 AI大模型方向编辑作者 具身智能机器人方向编辑作者 终端硬件方向编辑作者 AI新媒体编辑(微博/小红书方向) 紧跟AI浪潮 :密切关注A ...