Anthropic专家揭秘强化学习突破、算力竞赛与AGI之路 | Jinqiu Select
锦秋集·2025-05-25 04:19
"2026年,AI将能完成初级工程师一天的工作量。"这是Anthropic强化学习专家Sholto Douglas的理性预测。 回望过去2年的发展轨迹,我们能够清晰地看到一条加速上升的曲线:从2023年3月GPT-4奠定基础,到2024年 6月Claude 3.5 Sonnet在编码评估中解决64%的问题,再到Cursor在12个月内实现从100万到1亿美元年收入的惊 人增长,每一个节点都标志着AI从"代码助手"向"编程伙伴"的深刻转变。 最新的突破出现在2024年9月。OpenAI的o1模型通过强化学习,真正开启了AI推理的新纪元——它不仅在编码 复杂性和准确性上实现了显著跃升,更重要的是,这种能力随着模型规模的扩大呈现出持续增强的趋势。 编程领域之所以成为AI能力跃升的先锋阵地,源于其独特的优势:即时的反馈循环、明确的成功标准、以及 丰富的高质量训练数据。 这种"18-24个月能力倍增"的模式,正将我们推向一个临界点。Douglas的2026年预测,实际上是对这一发展轨 迹的理性延伸。 Anthropic的强化学习规模化专家Sholto Douglas与机械可解释性团队的Trenton Bricken接受 ...