Workflow
LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
机器之心·2025-08-12 03:10

机器之心报道 编辑:冷猫 随着推理大模型和思维链的出现与普及,大模型具备了「深度思考」的能力,不同任务的泛用性得到了很大的提高。 借助思维链,大模型能够对任务进行深入分析,完成任务规划与拆解,从而胜任长周期、复杂度高的工作。同时,我们也能更直观地了解模型的推理与分析过 程,从中发现执行环节中的问题,并有针对性地调整指令,以更高效地完成目标。 可以说,有了「深度思考」的推理模型,才有了现在拥有多种辅助功能与自主能力的 AI 智能体。 这不,AI 领域的大牛 Andrej Karpathy 也感觉到不对劲,发了长文推来指出这个令人无语的现象。 Karpathy 说,「 LLM 在默认状态下正变得比我日常使用需求更具『自主代理(Agentic)』倾向 ,甚至有些超出了我的平均使用场景」。 最明显的的确是编码任务,模型现在往往会进行较长时间的推理,倾向于在整个代码库中列出并搜索(grep)文件,会反复进行网络搜索,对一些在开发中、且明 显并不完整的代码里极少出现的边缘情况过度分析、过度思考,甚至在非常简单的查询中,也常常需要几分钟后才返回结果。 尤其是在简单的任务中,比如在运行脚本前快速检查索引错误或其他低级错误,根 ...