LLM总是把简单任务复杂化，Karpathy无语：有些任务无需那么多思考

机器之心报道编辑：冷猫随着推理大模型和思维链的出现与普及，大模型具备了「深度思考」的能力，不同任务的泛用性得到了很大的提高。借助思维链，大模型能够对任务进行深入分析，完成任务规划与拆解，从而胜任长周期、复杂度高的工作。同时，我们也能更直观地了解模型的推理与分析过程，从中发现执行环节中的问题，并有针对性地调整指令，以更高效地完成目标。可以说，有了「深度思考」的推理模型，才有了现在拥有多种辅助功能与自主能力的 AI 智能体。这不，AI 领域的大牛 Andrej Karpathy 也感觉到不对劲，发了长文推来指出这个令人无语的现象。 Karpathy 说，「 LLM 在默认状态下正变得比我日常使用需求更具『自主代理（Agentic）』倾向，甚至有些超出了我的平均使用场景」。最明显的的确是编码任务，模型现在往往会进行较长时间的推理，倾向于在整个代码库中列出并搜索（grep）文件，会反复进行网络搜索，对一些在开发中、且明显并不完整的代码里极少出现的边缘情况过度分析、过度思考，甚至在非常简单的查询中，也常常需要几分钟后才返回结果。尤其是在简单的任务中，比如在运行脚本前快速检查索引错误或其他低级错误，根 ...