Workflow
人工智能编码模型
icon
Search documents
最强编码模型Claude 4!7小时不间断写代码,连玩24小时宝可梦,GitHub已选为Copilot底层模型
创业邦· 2025-05-23 03:11
来源丨 量子位(ID: QbitAI) 作者丨 白交 衡宇 图源丨 Anthropic AI圈子好热闹。今天凌晨,Claude终于迎来了它的重大版本升级——Claude 4来了! | | Claude | Claude | Claude | OpenAl o3 | OpenAl | Gemini 2.5 Pro | | --- | --- | --- | --- | --- | --- | --- | | | Opus 4 | Sonnet 4 | Sonnet 3.7 | | GPT-4.1 | Preview (05-06) | | Agentic coding | 72.5% / | 72.7% / | 62.3% / | 69.1% | 54.6% | 63.2% | | SWE-bench Verified1.8 | 79.4% | 80.2% | 70.3% | | | | | Agentic terminal coding | 43.2% / | 35.5% / | 35.2% | 30.2% | 30.3% | 25.3% | | Terminal-bench2,5 | 50.0% | 41. ...
速递|AI编程争夺战,GPT-4.1用32KToken输出上限碾压前代,却藏50%准确率滑坡
Z Potentials· 2025-04-15 04:57
图片来源: Unsplash OpenAI 于 4月 14 日, 推出了名为 GPT-4.1 的新模型系列,新 AI 模型专注于编码。 GPT-4.1 面世之际,正值 OpenAI 的竞争对手如谷歌和 Anthropic 加紧研发高级编程模型。 谷歌最新发布的 Gemini 2.5 Pro 同样具备 100 万 token 上下文窗口,在主流编程基准测试中名列前 茅。 Anthropic 的 Claude 3.7 Sonnet 与中国 AI 初创公司深度求索升级的 V3 模型亦表现不俗。 包括 OpenAI 在内的许多科技巨头的目标,是训练能够执行复杂软件工程任务的人工智能编码模型。 正如首席财务官 Sarah Friar 上个月在伦敦的一次科技峰会上所言, OpenAI 的宏伟抱负是创造一 个"自主软件工程师"。该公司宣称,其未来的模型将能够端到端地编程整个应用程序,处理质量保 证、错误测试和文档编写等方面。 GPT-4.1 是朝着这个方向迈出的一步。 "我们根据直接反馈优化了 GPT-4.1 ,以在实际应用中改进开发者最关心的领域:前端编码、减少无 关的编辑、可靠地遵循格式、遵守响应结构和顺序、一致的工具 ...