Workflow
Chain of Thought (CoT)
icon
Search documents
刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
量子位· 2025-08-05 21:09
而这次的名字也是非常的直接,gpt-oss,即Open Source Series,意思就是"开源系列"。 它们的亮点如下: 并且它俩均采用Apache 2.0许可证,允许商用无需付费或授权。 从性能角度来看,gpt-oss已经达到了开源模型里推理性能的第一梯队,但在代码生成和复杂推理任务中仍略逊于闭源模型(如GPT-o3和 o4-mini)。 gpt-oss-120b :1170亿参数(MoE架构,激活参数约51亿),可在单张80GB GPU上运行,性能接近闭源的o4-mini。 gpt-oss-20b :210亿参数(Moe架构,激活参数约36亿),可在16GB内存的消费级设备上运行,性能接近o3-mini。 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 没能等到GPT-5,但OpenAI在深夜却 很突然地open了一下 —— 开源两个推理模型: gpt-oss-120b 和 gpt-oss-20b 。 要知道,上一次OpenAI开源模型还是6年前,也就是2019年的GPT-2。 | | gpt-oss-120b | gpt-oss-20b | OpenAl o3 | OpenAl o4-mini ...
会“思考”的目标检测模型来了!IDEA提出Rex-Thinker:基于思维链的指代物体检测模型,准确率+可解释性双突破
机器之心· 2025-06-30 10:23
图 1 :指代检测的应用场景实例 最近, IDEA 提出全新解决方案 Rex-Thinker ,首次将人类思维中的 "逻辑推理链" 引入视觉指代任务,让 AI 像人一样分步思考、验证证据,在权威测评中不仅准 确率显著提升,更展现出强大的 "知之为知之" 能力! Caption : Rex-Thinker 的思考过程 在日常生活中,我们常通过语言描述寻找特定物体:"穿蓝衬衫的人""桌子左边的杯子"。如何让 AI 精准理解这类指令并定位目标,一直是计算机视觉的核心挑 战。现有方法常被两大问题困扰: 决策过程不透明 ("黑箱" 预测)和 拒识能力不足 (对不存在物体输出错误结果)。 Demo论文地址: https://arxiv.org/abs/2506.04034 突破在哪?让 AI 学会 "思考三步走" 传统模型直接输出目标检测框,而 Rex-Thinker 创新性地构建了可解释的推理框架: 1. 规划 (Planning) 拆解语言指令:"找到坐在乌龟上的人" → 分解为 "第一步找到乌龟 → 第二步判断每个人是否坐在乌龟上" 2. 验证 (Action )对每个候选目标(如 "Person 1""Perso ...