Workflow
Cursor技术负责人详解AI编程三大难题:奖励信号、过程优化与经验积累 | Jinqiu Select
锦秋集·2025-05-31 02:37

AI编程的下一步在哪里?Cursor技术负责人的深度思考 让AI生成看起来像代码的文本很容易,但让它真正理解问题、选择合适的工具、经过多轮调试最终解决实际 需求——这才是真正的编程,也是整个行业正在努力突破的方向。 在最新访谈中,Cursor的技术负责人深入剖析了AI编程的根本性困境。 https://www.youtube.com/watch?v=sLaxGAL_Pl0&t=21s Cursor认为,AI编程不只是生成语法正确的代码片段,而是要完成一个复杂的认知过程。 编程与数学等领域的根本区别在于"动作空间"的庞大。解数学题时,模型可以通过推理逐步逼近答案,但在编 程中,推理过程本身就已经嵌入在代码里。更关键的是,真正的编程需要"编写代码→调用工具→获取反馈→ 调整代码"的多轮迭代。 奖励信号的设计成为核心难题。用"通过测试"作为奖励看似合理,但模型会找捷径绕过核心逻辑。它生成了能 运行的代码,却没有真正理解和解决问题。即使加入代码质量等多维度指标,稀疏奖励的问题依然存在——复 杂任务可能需要上千次尝试才获得一次成功信号。 业界寄予厚望的过程奖励模型(PRMs)同样遭遇挫折。这种试图在每一步都给出评分的方 ...