必须得让AI明白,有些不该碰的东西别碰(doge)
量子位·2025-12-29 09:01

然而,一个问题逐渐显现: 视觉工具用得越多,模型真的更聪明吗? 大量实验发现,许多模型正在陷入"盲目用工具"的状态——即便任务并不需要,也会条件反射式地调用裁剪、抽帧、区域放大等工具。 结果却是:推理路径更长了,算力消耗更高了,准确率却没有同步提升,甚至在部分任务中出现下降。 这并不是工具不够强,而是模型从来没有学会一件事:什么时候真的值得用工具。 来自港中文MMLab等的研究团队,针对这一核心问题提出了 AdaTooler-V ——一个具备 自适应工具使用能力 的多模态推理模型,让模型 学会判断"该不该用工具",而不只是"怎么用工具"。 AdaTooler-V团队 投稿 量子位 | 公众号 QbitAI 近期,以DeepEyes、Thymes为代表的类o3模型通过调用视觉工具,突破了传统纯文本CoT的限制,在视觉推理任务中取得了优异表现。 在12个主流图像和视频推理基准上,AdaTooler-V展现出了显著优势。例如,在高分辨率视觉推理任务V 上,AdaTooler-V-7B的准确率达 到 *89.8% 工具使用的有效性探究 研究团队引入了一个关键指标—— Tool Benefit Score (工具有益分 ...

必须得让AI明白,有些不该碰的东西别碰(doge) - Reportify