Workflow
量子位
icon
Search documents
Manus终于开放注册!每天能免费玩一次
量子位· 2025-05-13 01:03
Manus产品合伙人张涛表示,这是Manus团队两个月以来努力的成果: 希望大家能够享受Manus的魅力。 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 一夜带火整个智能体赛道的 Manus , 终终终于开放注册了 。 并且所有用户每天都能至少免费玩一次: 开局就送 1000 积分,每天还能再 +300 。 实测像这样做让Manus帮忙做一份租房攻略,消耗了267积分: 网友:还有点贵 有一说一,真想拿Manus整点活,免费的积分还是不咋够用的。 Manus为有需求的用户提供了3档会员服务,从每月 19刀 到 199刀 不等。 | 升级你的计划获取更多积分 | | × | | --- | --- | --- | | Manus Basic Beta | Manus Plus Beta | Manus Pro Beta | | $19/月 | $39,用 | $199/月 | | ● 按年支付 节省17% | ● 按年支付 节省17% | ● 按年支付 节省17% | | 升级到 Basic | 升级到 Plus | 升级到 Pro | | √ 每月 1,900 积分 了解更多 | √ 每月 3,900 ...
Claude1.7万字系统提示词全网刷屏!Karpathy锐评:LLM训练缺乏关键范式
量子位· 2025-05-13 01:03
全网刷屏的Claude系统提示词,结果被卡帕西大神当场抓虫?! 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 事情是这样的。 一夜之间,近 1.7万 字系统提示词——包含 24000 个token,详细定义了模型行为、工具使用和引用格式…..全部细节直接在GitHub上被泄 露了! 这事儿一出,网友蜂拥而至速速围观,甚至亲切地称呼 这次意外泄漏事件是提示技术的金矿 。 就在此时,大神卡帕西发现了华点: LLM学习缺少主要范式? 随即他提出系统提示学习新范式—— 模拟人类经验积累过程,将系统提示嵌入权重。 简单总结一下,就是模拟人类学习,为LLM提供备忘录功能,让LLM拥有自主反思用户问题的"记忆"功能,记录通用的问题解决知识和策略。 新范式一石激起千层浪,有人表示赞同,也有人开始着手分析新范式帮助LLM畅玩Minecraft的可行性: 当然也有人持反对意见,认为允许模型自己编写提示会使模型更加混乱,也无法保证模型不会错误地理解提示。 具体是怎么一回事呢?别急,接下来让我们一起来回顾整个事件。 Claude系统提示词曝光 据揭露,完整的Claude系统提示词包含 16739 个字,也就是 110kb 。 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-13 01:03
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
8秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布
量子位· 2025-05-12 04:11
DreamO团队 投稿 量子位 | 公众号 QbitAI 可控图片生成,如今已经不是什么新鲜事。甚至也不需要复杂的提示词,用户通过简单的文本描述,就能快速生成符合个人需求的创意图像。 不过仍然有一些局限: 比如说,虽然可以实现单一任务(如身份、主体、风格、背景等)的定制化设计,可是一旦条件增多,就会出现"鱼和熊掌不可兼得"的问题。 只有小孩子才做选择题,成年人当然是全都要! 字节跳动与北京大学联合起来,证明了"全都要"的可行性:一种支持多条件组合的统一图像定制化生成框架—— DreamO ,堂堂登场。 这个框架通过单一模型便可以实现主体、身份、风格及服装参考的多样化定制,并支持不同控制条件的自由组合,非常适应实际应用中的复杂 需求。 △ 参考多个主体的生成结果 那么就有人问了,他们是怎么做到的呢?这个框架和现有的商业大模型相比有什么优势呢? 一起来看技术细节。 DreamO:成本更低、速度更快 字节跳动和北大团队提出了统一的图像定制化生成框架DreamO,以极低的训练参数量(400M),就实现了如下图所展示的多种类型高质量 图像定制化结果: 该工作旨在通过单一模型完成各种定制化任务。 根据参考,生成一张魔幻风 ...
陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明
量子位· 2025-05-12 04:11
白交 一水 发自 凹非寺 量子位 | 公众号 QbitAI 快来围观,陶哲轩当视频博主了。 第一个产出就很炸裂: 人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了?! 整个过程看起来一气呵成,还是全程 "盲证" 不用过脑子那种。 对于这一操作,网友们惊呆:这具有足够的历史意义。 在没有明显引导、宣传之下,他的订阅数一天时间已经有900+,观看数超两千,目前仍然在高速增长中。 大家赶在爆火之前留言: 今天我们相聚在这里,就是为了见证伟大数学频道的诞生。 具体来看看是如何做到? 33分钟盲证定理 陶哲轩这次选取了泛代数中的一个命题,即 证明Magma方程E1689蕴含E2 。 方程具体是什么不重要,我们只需要了解,即使是方程理论项目的合作者Bruno Le Floch,也足足人工花了一页纸才完成证明。 而用上AI后,整个证明过程仅用时 33分钟 : 具体而言,陶哲轩尝试完全基于Bruno Le Floch的草稿,逐行进行形式化。 他将草稿拆分为微小逻辑单元,交由 GitHub Copilot生成代码骨架,再以Lean的canonical策略匹配填补细节 ,过程中也涉及部分手动补 全。 最终,整个形式化证明 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-12 04:11
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业 视野。 ...
清华&通院推出"绝对零"训练法,零外部数据大模型自我博弈解锁推理能力
量子位· 2025-05-12 04:11
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 不用引入外部数据 ,通过自我博弈(Self-play)就能让预训练大模型学会推理? 来自清华、北京通用人工智能研究院和宾夕法尼亚州立大学的研究人员,提出了一种名为 "绝对零" (Absolute Zero)的训练方式。 这种方法通过让大模型根据推理目标,自己生成并解决任务,便可以获得推理能力。 测试中,用"绝对零"训练出的模型,表现已 经超过了用专家标注样本训练的模型 。 并且"绝对零"方法只需在代码环境中训练,但可以让模型在数学推理上也取得显著进步。 这项研究也在Reddit上引发了讨论,开帖转载的网友惊叹:会自我进化的AI已经被解锁了? Proposer负责生成新的推理任务,Solver负责解决这些任务。通过两个角色的交替和协同,模型可以自主地构建学习任务分布,并在求解任 务的过程中不断提升推理能力。 "绝对零"将所有的推理任务统一表示为 (p,i,o) (即程序,输入,输出)的三元组形式。 这里的程序是一段可执行的代码,输入是该程序的输入数据,输出是程序在给定输入下的输出结果。 在出题-做题中自我学习 "绝对零"采用了一种自我博弈的学习范式。在这个 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-05-11 04:20
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深入浅出讲解原理; 有写代码能力; 量子位长期读者。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知 体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领 袖。 在招岗位包括: AI大模型方向编辑作者 你需要做什么? 我们希望你是: 具身智能机器人方向编辑作者 拓展行业人脉 :与AI领域大咖零距离接触,参与重要科技活动 ...
DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制
量子位· 2025-05-11 04:20
DEER团队 投稿 量子位 | 公众号 QbitAI 长思维链让大模型具备了推理能力,但如果过度思考,就有可能成为负担。 华为联合中科院信工所提出了一种新的模式,让大模型 提前终止思考 来避免这一问题。 利用这种方法, 无需额外训练,就可以让大模型的精度和效率同时提升 。 这种方式名为 DEER ,也就是 动态提前退出推理 (Dynamic Early Exit in Reasoning) 的简称。 其核心在于找到推理信息质量下降之前的临界点,并在临界点及时让大模型中断推理。 结果在多个推理基准中,DEER在DeepSeek系列推理LLM上始终有效,将思维链生成长度平均减少31%到43%,同时将准确率提高1.7%到 5.7%。 截至目前,DEER已在QwQ、Qwen3、Nemotron等更多推理模型和11个评测集上被验证持续有效。 停止推理的临界点,需要动态规划 直观上,随着思维链中的推理路径数量的增加,生成结论时可参考的信息也会更多。 如果能够识别出推理信息变得刚好足够的临界点 (称为珍珠推理,Pearl Reasoning) ,并迫使模型在此点停止进一步思考并直接输出结 论,就可以同时实现准确率和效率。 ...
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
量子位· 2025-05-11 04:20
克雷西 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 字节Seed首次开源代码模型! Seed-Coder ,8B规模,超越Qwen3,拿下多个SOTA。 它证明 "只需极少人工参与,LLM就能自行管理代码训练数据" 。 通过 自身生成和筛选 高质量训练数据,可大幅提升模型代码生成能力。 这可以被视为对DeepSeek-R1模型自我生成和筛选训练数据策略的扩展。 一共包含三个版本: Base Instruct Reasoning 其中,Instruct在编程方面表现出色,拿下两个测试基准SOTA。 | Model | Size | | SWE-bench Verified | Multi-SWE-bench mini | | --- | --- | --- | --- | --- | | Agentless | | | OpenHands | Agentless | | ~8B Models | | | | | | Yi-Coder-9B-Chat | 9B | 0.0 | 1.6 | 0.0 | | Llama-3.1-8B-Instruct | 8B | 1.0 | 1.2 | 0.5 | | Q ...