量子位

Search documents
不用等R2了!第三方给新版DeepSeek V3添加深度思考,推理101秒破解7米甘蔗过2米门
量子位· 2025-04-28 06:36
1.2T万亿参数,5.2PB训练数据,高效利用华为芯片……只能说如果有一半是真的都很牛了。 HuggingFace创始人此时推荐"以不变应万变",打开官方认证账号的更新提醒,就能第一时间获取通知。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek即将发布R2??坊间传闻越来越多了,且 难辨真假 。 抛开具体泄露数据是否准确,大家似乎有一个共识: 如果真的有R2,它的基础模型会是新版DeepSeek V3-0324 。 之所以有很多人相信R2会在4月底发布,有一部分原因也是出于R1与V3之间相隔了一个月左右。 现在,等不及DeepSeek官方, 开源社区已经开始自己动手给V3-0324加入深度思考了 。 新模型 DeepSeek-R1T-Chimera ,能力与原版R1相当,但速度更快,输出token减少40%,也是基于MIT协议开放权重。 相当于拥有接近R1的能力和接近V3-0324的速度,结合了两者的优点。 而且做到这一点,不是靠微调或蒸馏,而是DeepSeek V3-0324和R1两个模型融合而成。 R1+V3融合模型 新模型R1T-Chimera并非DeepSeek官方出品,而是来 ...
小小井字棋难倒大模型??大神卡帕西被OpenAI在线踢馆了
量子位· 2025-04-28 03:43
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 宝可梦之后,让大模型玩 井字棋 又成了一个新的热门挑战。 起因是网友在X上吐槽大模型宝可梦玩得不够好,结果被大神 Karpathy 翻了牌子: 别盯着宝可梦了,让大模型玩井字棋会更有趣,它们不会。 结果Karpathy的话引发了大量围观,有人表示惊讶,也有人在分析原因,还有人表示那句经典的话含金量还在上升: 对人类而言很简单的任务,对机器来说反而很难;对人类而言难的任务,对机器来说反而简单。 不过也有人表示不服,其中就包括OpenAI的 Noam Brown ,他表示让o3玩井字棋完全没问题, 甚至还能看图下棋 。 大模型挑战井字棋 我们也尝试了一下,用不同的方式和o3对战。 第一种方式是用O和X表示棋子,-表示空位,每次直接把完整的棋局输入给o3,并要求其用同样的方式输出。 思考约12秒之后,o3首先占据了棋盘中央的位置,我们落子之后,o3又思考了23秒,放置了第二颗X棋子。 接下来的两个回合情况是这样,其实当o3占据对角线上两个位置的时候就已经锁定了胜局。 不过有意思的是,直到已经连成一条线, o3都没发现自己已经赢了 。 | | | | | XOO ...
中关村科金喻友平: “平台+应用+服务”是企业大模型落地的最佳路径 | 中国AIGC产业峰会
量子位· 2025-04-28 03:43
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 大模型技术加速向产业渗透,如何直击业务痛点、带来真实增效? "平台+应用+服务"是企业大模型落地的最佳路径。 在第三届AIGC产业大会上, 中关村科金总裁喻友平 分享如上方法论。 即使看似简单的需求,也需要经历需求拆解、数据调优与流程重构的闭环。在这个过程中,企服厂商需要提供好服务。 为了完整体现喻友平的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。 中国AIGC产业峰会是由量子位主办的AI领域前沿峰会,20余位产业代表与会讨论。线下参会观众超千人,线上直播观众320万+,累计曝光 2000万+。 话题要点 认知型AI亦遵循"C端先行、B端深化" 大模型技术正从消费端向产业端加速渗透; 认知性AI同样遵循"C端先行、B端深化"的路径; 企业需要端到端的解决方案而非孤立技术模块; 算法开源趋势使得数据主权愈加重要; 企业大模型落地最佳路径就是做好"平台+应用+服务"。 各位嘉宾下午好,非常荣幸受邀参与量子位大会的分享。此前各位专家已就前沿技术展开深度探讨,我的主题则聚焦于 大模型在企业服务领 域的落地实践——如何通过技 ...
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
量子位· 2025-04-28 03:43
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 全球AI大模型智能涌现,现在正在进入"多模态时间"。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI应用和落地的需求中,多模态也是最重要的能力。没有多模态技术,何谈应用和落地? 实际上,多模态的先锋共识和趋势,把代表性玩家的进展连点成线,也能看出来…… 看看行业公认的多模态卷王,阶跃星辰—— 刚刚过去的一个月,陆续上新的3款模型,全是多模态 ,有图生视频开源模型,有多模态推理模型,还有图像编辑开源模型。 模态丰富,上新频繁,性能出色。 之所以把阶跃的这些发布连点成线解读,也是因为阶跃从一开始的强落地和强应用属性。 目前,阶跃已发布的模型里,七成都是多模态。鉴于多模态是Agent的必备要素,今年阶跃化身「落地型玩家」的态势愈发明显: 发力智能 终端Agent 。 过去一个月,卷王卷出了些啥? 据量子位整理回顾,过去一个月,阶跃星辰接连上新了3款模型: 它们覆盖了当前多模态模型的几大刚需方向,并且其中Step1X-Edit和Step-Video-TI2V已面向开发者开源。 怎么说呢,这很阶跃,也很符合技术流和行业玩家们对"多模态 ...
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
量子位· 2025-04-28 03:43
人类在解答几何问题时,首先会识别所需的几何原理并通过灵活应用它们来推导出答案。 然而,目前的评测方法多集中于最终答案的正确性或简单地对每个推理步骤进行打分,而 忽视了推理过程中的关键因素:几何原理的识别和 应用 。 尽管有研究发现模型的对几何图的感知能力不足限制了其后续推理,但实验发现,几何原理与图像中几何元素的正确对应及应用,是多模态大 模型推理的另一大瓶颈。 为填补这一空白,GeoSense出现了,为在复杂视觉场景中的推理能力提升提供了新的方向。 GeoSense团队 投稿 量子位 | 公众号 QbitAI 多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense ,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。 其背后团队来自 淘天集团算法技术-未来生活实验室团队。 5层知识架构+1789道几何问题 GeoSense旨在系统评估多模态大模型识别和应用几何原理来解决几何问题的能力。 该基准建立了包含定义、定理和公式等几何原理的5层知识架构,覆盖平面几何和立体几何,支持中英双语;精心构建并人工详细标注了 ...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位· 2025-04-28 03:43
DeepSeek 发自 凹非寺 量子位 | 公众号 QbitAI 未来同事,你好~ 这是一则 招聘帖 。 量子位 是一个关注AI及前沿科技的新媒体平台,我们着迷于全新技术和趋势带来的改变,并 正致力于帮助更多人第一时间看懂新趋势、新机遇。 如果你与我们志同道合,对 AI大模型、具身智能、终端硬件、AI新媒体编辑 感兴趣,我们 正在招聘这些领域的原创作者。 以下岗位均为全职,工作地点:北京中关村。 岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正 加分项: AI大模型方向编辑作者 具身智能机器人方向编辑作者 终端硬件方向编辑作者 AI新媒体编辑(微博/小红书方向) 紧跟AI浪潮 :密切关注AI、大模型领域的最新动态和进展,保持对行业趋势的敏锐 洞察。 挖掘优质选题 :深入挖掘AI大模型领域的优质选题,策划并撰写深度文章、行业分 析等内容。 十级冲浪选手 :活跃于各大网络平台,收集整理行业资讯,捕捉热点话题。 参与内容运营 :学习并参与量子位内容的全平台运营,提升内容传播力和影响力。 具身智能机器人方向编辑作者 加入我们,你可以获得: 乐于探索AI新工具,善用AI新工具; 拥有解读论文的能力,能深 ...
7x24小时非人类科学家入场:当AI开始自主探索科学未知领域 | 多伦多大学
量子位· 2025-04-27 08:19
universea 投稿 量子位 | 公众号 QbitAI 自主通才科学家(AGS)正成为现实! 来自多伦多大学、IIT、清华大学、浙江大学、罗格斯大学、哈佛大学、佐治亚理工学院和伦敦大学学院的跨学科团队的最新研究指出,融合 人工智能与机器人技术的"自主通才科学家(AGS)"不仅能独立完成从文献综述到实验验证的全流程,更可能以指数级速度推动科学发现,突 破人类能力的物理与认知边界。 除此之外,其团队还构建了将AI大脑与机器人躯体深度融合的通用科研系统概念框架,展示了机器人与AI科学家在自然科学、形式科学、应用 科学、人文科学,以及跨学科科学等全科学领域的原创性发现的潜力。 超级智能的曙光:AI与机器人科学家引领科研新时代 相比AI在工业生产或家庭生活中替代人类劳动,其在科学发现中的应用更能体现通用人工智能的真正价值——引领并超越人类水平的科研成 果,或许正是衡量超级智能的关键标准。 机器人与AI科学家正携手突破科学的边界,迎来一个全新的扩展定律(Scaling Laws),开启一个自主科学探索的新时代。 一、当AI大脑邂逅机器人躯体:通才自主科学家的诞生 自主通才科学家(AGS)正成为现实,这种系统将AI的智 ...
数学家们仍在追赶天才拉马努金
量子位· 2025-04-27 08:19
鱼羊 一水 发自 凹非寺 量子位 | 公众号 QbitAI 如果有这么一个人,写下这样的复杂公式,并声称是受女神梦中启发所得,大家伙儿通常会送他两个字: 民科 。 但当这个人一生中数千次写下类似的数学公式和命题,并在此后的100年间,不断地被证实正确,那么就只有一个可能—— 他是拉马努金。 之所以再度火爆,是因为直到今天,数学界还不断有最新发现,在验证他当年留下的"谜题"。 拉马努金, 一位全数学界公认的神人 ,被认为是数学史上最伟大的天才之一: 没有接受过正统数学教育 ,在印度挂科到本科学位都没拿到,却凭借自己惊人的数学直觉征服数学大师G.H.哈代,使得剑桥大学三一学院的 大门破例向他打开。 32岁就英年早逝,职业搞数学的时间只有短短6年,但他的数学笔记至今仍是传奇—— 留下了近4000个公式,很多都在后来被证明正确 。 他的恩师哈代甚至开玩笑说,自己对数学最大的贡献就是发现了拉马努金: 和拉马努金的交往是我一生中唯一的浪漫事件。 △ 中间为拉马努金,最右为G.H.哈代 直到今天,后辈数学家们仍在追赶着拉马努金的步伐。 "梦中女神的启示" 拉马努金传奇故事的构成要素之一,是他独特的做数学的方式。 简单来说就 ...
不到2年,AI PPT赛道第一!像素绽放CEO赵充:今年是AI应用创业最佳时期 | 中国AIGC产业峰会
量子位· 2025-04-27 08:19
编辑部 整理自 凹非寺 量子位 | 公众号 QbitAI 今年是AI应用创业最好的时期。 在第三届AIGC产业峰会上,不到2年时间在AI PPT赛道做到NO.1的赵充如是说。 原因有三: 1)DeepSeek带动了整个AI应用市场的大盘,整体渗透率不止一倍大幅提升; 2)所有应用的范式都在发生切换,大量重新定义产品的机会涌现; 3)DeepSeek的出现让成本又降低了大约10倍。 为了完整体现赵充的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。 中国AIGC产业峰会是由量子位主办的AI领域前沿峰会,20余位产业代表与会讨论。线下参会观众超千人,线上直播观众320万+,累计曝光 2000万+。 话题要点 以下为赵充演讲全文: 赵充是 像素绽放PixelBloom(AiPPT.com) CEO ,旗下产品AiPPT.com自2023年8月上线以来,已经积累 2000多万用户,是大模型趋势中 表现最亮眼的AI产品之一。 AiPPT.cn诞生于内部赛马 他表示,中国AI应用正在走向全球,成为"世界工厂",这是一个非常重要的趋势。明年可能有更多中国AI应用走向世界。 谢谢大家,很高 ...