Anthropic发布Claude 4.1编程测试称霸
Sou Hu Cai Jing·2025-08-07 03:01
Anthropic在周一发布了其旗舰人工智能模型的升级版本,在软件工程任务上达到了新的性能高度。这 家AI初创公司正加快步伐以在竞争激烈的编程市场中保持主导地位,尤其是在OpenAI预计推出竞争性 挑战之前。 新的Claude Opus 4.1模型在SWE-bench Verified基准测试中获得了74.5%的成绩,这是一个备受关注的基 准测试,用于评估AI系统解决现实世界软件工程问题的能力。这一表现超越了OpenAI的o3模型 (69.1%)和谷歌的Gemini 2.5 Pro(67.2%),巩固了Anthropic在AI编程辅助领域的领先地位。 此次发布正值Anthropic实现惊人增长之际,根据行业数据,该公司的年度经常性收入在短短7个月内从 10亿美元跃升至50亿美元,增长了五倍。然而,公司的快速崛起也带来了危险的依赖性:其31亿美元 API收入中,近一半来自仅仅两个客户——编程助手Cursor和微软的GitHub Copilot,两者合计产生14亿 美元收入。 罗技高级产品经理Guillaume Leverdier在社交媒体上对这一收入集中度数据回应道:"这是一个非常可怕 的处境。一个合同的变更就 ...