Workflow
代码生成
icon
Search documents
不靠Agent,4步修复真Bug!蚂蚁CGM登顶SWE-Bench开源榜
机器之心· 2025-06-27 06:44
机器之心报道 编辑:吴昕 Agentless+开源模型,也能高质量完成仓库级代码修复任务,效果媲美业界 SOTA 。 一、Agentless 、44% 与 NO.1 说到 AI 写代码的实力,大家最关心的还是一个问题:能不能真修 bug ? 首个全自动 AI 软件工程师 Devin 一出场就引爆了技术圈,其江湖地位也在权威基准 SWE-Bench 上被进一步坐实—— 独立解决了 13.86% 的问题,远远甩开 GPT-4 仅有的 1.7% ,Claude2 也不过 4.8% 。 没过多久,Genie 又在同一测试中直接将得分拉升至 30.08% ,曾一度登顶全球最强 AI 程序员。 SWE-Bench 为何能赢得工业界、学术界和创业团队广泛关注?因为,它够真实。 这套由普林斯顿大学提出的测试集,任务全部来自真实的 GitHub 项目—— 问题要么是开发者在生产环境中遇到的 bug ,要么是功能开发中的典型需求,难度大、上下文复杂,最大程度地还原了程序员在真实开发中的工作状态。 换句话说,能在 SWE-Bench 上拿高分的模型,必须具备一个经验丰富软件工程师的复杂技能和经验,而这些恰恰是传统代码生成 benc ...
AI编码工具双雄也开始商业互捧了?Cursor × Claude 最新对谈:两年后,几乎100%代码都将由AI生成!
AI前线· 2025-06-21 03:38
编译 | 宇琪、冬梅 更可怕的数字是,据美国一家纸媒报道,Cursor 每日编写 10 亿行代码。 Cursor 推出不到两年,就实现了大多数 SaaS 公司需要十年才能实现的目标:年经常性收入 1 亿美元。 对于 Cursor 取得如今的成就,有 X 用户表示的确让人震惊。 "仅有 50 位工程师,每秒 100 万笔交易……每位工程师负责 2 万笔交易,太不可思议了!" 在硅谷层出不穷的创业故事中,Cursor 的起源看起来像是一个标准模板——四位麻省理工的计算 机天才,对"开发者生产力"有着近乎偏执的追求。他们的故事有着太多让人惊叹的地方:公司成 立一年半,总融资达到 95 亿、 4 位创始人年龄均为 25 岁、公司在 4 个月内 ARR 从 1 亿增至 3 亿、整个公司不到 50 人、每天编写 10 亿行代码...... 但这个故事的反转在于:他们拒绝成为又一个被风口吹起的泡沫。 2023 年 10 月,他们获得了由 OpenAI 领投的 800 万美元种子轮融资。这笔支持不仅仅是财务 上的认可,更是与这家引领 AI 革命的公司达成的战略联盟。当其他初创公司追逐消费级应用或 企业级工作流程时,Curso ...
AI 编程终结的不是代码,而是作为「容器」的软件
Founder Park· 2025-06-03 12:56
以下文章来源于范阳 ,作者范阳 范阳 . This is a "living media", 目标是建立一种文化, 使前沿科技和风险投资为人类服务,而不是把人类和生态作为手段。我是一名创业者,科技投资人和内容创 作者,这里也是我学习和成长的地方。 2005 年 YouTube 的「上传」按钮开启了内容创作的民主化时代。而现在,AI 以「描述」这一动词,正在改变我们对于软件的认知与生产方式。 一年后,这个预测逐渐应验。Chris Paik 近期再次发布了一篇博客文章《无限代码的黎明》,顺着这个方向,提出随着大语言模型(LLM)将代码生成的 成本降至趋近于零,传统意义上作为独立「应用程序」或「平台」存在的软件形式将逐渐消失。这篇文章的最核心观点是:软件的终结并非代码的死亡, 而是其作为「容器」的消融。 以下为文章原文,内容略有调整。 原文链接: https://docs.google.com/document/d/1Dm9UrhgaRMu_DjOz5KluO7ibOsPaUVQgwnC5-ccw9_g/mobilebasic 超 4000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者 ...
AI应用浪潮风靡全球!“OpenAI劲敌“Anthropic 创收规模五个月翻三倍
智通财经网· 2025-05-31 03:41
智通财经APP获悉,据媒体援引知情人士透露的消息报道称,生成式AI领域领军者、有着"OpenAI劲 敌"称号的Anthropic年化营收已达约 30亿美元,这为生成式AI应用软件在商业世界的真实应用需求提供 了强劲的早期验证。 知情人士称,这一里程碑将该公司当前销售额按全年基准推算得出,即能够预测该公司基于当前营收的 一年内整体销售额,较2024年12月的近10亿美元年化营收大幅跃升。其中一位消息人士表示,这一数字 在3月底突破 20 亿美元,并在5月底达到30亿美元,其整体的创收能力在短短5个月内翻了足足三倍。 尽管青睐生成式AI的消费者们普遍热衷于竞争对手OpenAI 的 ChatGPT,但是企业层面普遍对于AI 兴趣 浓厚,不过一部分企业对于AI在企业内部的全面推广仍处于试验阶段。消息人士称,Anthropic 营收激 增主要来自于向其他公司销售定制化的"AI大模型即服务",将Anthropic大模型定制部署于企业内部的各 种复杂任务进而大幅提升经营效率,这一数据点显示出企业级AI应用软件的需求确实处于大幅增长态 势。 一个关键驱动因素是基于强大AI技术的代码生成。这家总部位于旧金山,得到谷歌母公司Al ...
美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节
机器之心· 2025-05-30 04:16
机器之心报道 编辑:泽南 一句话,呈所想。 谁都没有想到,如此实用的 AI 代码生成工具,竟是出自美团。 上周,有媒体曝出了美团的 AI 零代码工具 NoCode,这是一款无需编程背景和经验,仅通过自然语言和对话形式即可快速生成 应用的工具。 顾名思义,NoCode 可帮助很多人以「零代码」的方式创建个人提效工具、产品原型、可交互页面等。它不仅能生成代码,还可 以进行实时预览,局部修改并一键部署,大幅降低了开发的门槛,可以帮助更多人释放创意。 而且,NoCode 是完全免费的,用美团 App 或微信扫码就能登录。 产品链接:https://nocode.cn/ NoCode 是美团开放 AI 生态的最新实践,旨在通过免费开放自身积累的 AI 技术能力,助力中小商户实现 IT 化与数字化升级, 同时让更多用户体验 AI 技术带来的效率提升与创新乐趣。在公司内部,人们已经利用它构建出了从网站页面到效率工具、数据分 析再到简单游戏等大量不同种类的应用。 虽然目前还未正式发布,不过我们已经在社交网络上看到了一些使用 NoCode 构建产品的案例。 NoCode 由美团研发质量与效率团队研发,该团队属于美团基础研发平台 ...
整理:每日科技要闻速递(5月27日)
news flash· 2025-05-26 23:36
金十数据整理:每日科技要闻速递(5月27日) 3. 比亚迪引发新一波价格战担忧 业内:"隐性降价"或将长期存在。 其他: 1. 腾讯将发布全球首个全模态模型"混元-O"。 2. 微软开源浏览器Agent,可实时跟踪、控制智能体 3. 古尔曼:苹果全平台操作系统将迎设计革新。 4. 优时比重症肌无力创新药优迪革在中国上市。 5. 据称苹果将调整发布策略:一年发布两次iPhone新机。 6. OpenAI计划在未来几个月内设立首尔办事处。 7. 网传玄戒O1是向Arm定制的芯片?小米公司回应:这完全是谣言。 8. 三星HBM3E基本通过英伟达单芯片认证,成品认证或延迟到下半年完成。 9. 美团一季度一线城市高频骑手月均收入10010元。美团王兴回应京东外卖百亿补贴:将不惜代价赢得 竞争。美团新代码约52%由AI生成。 新能源汽车: 1. 碳酸锂期货跌破六万大关。 2. 深圳交警回应"余承东疑似开车睡觉":睡觉等行为影响安全,不允许。 ...
AI 写码一时爽,代码审查火葬场?GitHub Copilot 副总揭秘新瓶颈 | GTC 2025
AI科技大本营· 2025-03-31 06:55
我们距离 AI 在绝大多数软件开发任务中实现人类水平的能力和自主性大约还有 24 到 36 个月的时间。 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 主持人: 大家好,我是 NVIDIA 开发者工具 AI 技术软件工程总监,马特·弗雷泽(Matt Frazier)。 众所周知,AI 辅助开发者工具,或者说代码生成、AI 代码生成——现在有很多叫法——正在从根本上改变我们开发软件的方式。NVIDIA 自然非常关 注这一趋势如何影响我们处理软件和加速计算的方法。 为此,在 GTC 2025(英伟达大会)上,我们邀请了来自多家公司和不同行业的 AI 代码生成通用应用专家,以及 CUDA 优化与相关研究领域的专家, 共同探讨这个话题。 我想快速问各位读者几个问题: 如果你对以上任何一个问题感同身受或感到好奇,那么接下来的讨论就值得你关注。下面,我想介绍一下参与本次讨论的嘉宾。 莎娜·达马尼(Sana Damani) ,她是 NVIDIA 架构研究组的研究科学家,致力于提升 GPU 上并行应用程序的性能,以及提高调试和优化工作的易用 性。 有多少人特别在 CUDA 调试中使用过 AI 驱动的代 ...