Workflow
工作流
icon
Search documents
DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌
量子位· 2025-07-09 04:57
西风 发自 凹非寺 量子位 | 公众号 QbitAI "人类最后的考试"首次 突破30分 ,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过10分。 直到最近, 最高分也不过26.9 ,由Kimi-Research和Gemini Deep Research并列取得。 现在,上海交大联合深势科技团队突然发布了一项新研究,在"人类最后的考试" (HLE,Humanity's Last Exam) 上一举拿下 32.1分 , 创下新纪录。 在这项研究中,团队推出 工具增强推理智能体X-Master 、 多智能体工作流系统X-Master s。 划重点:还直接把这套方案给 开源 了。 网友们纷纷感叹现在AI竞赛太激烈,一天一个样。 另外值得一提的是,这项研究 使用了DeepSeek-R1-0528作为驱动智能体的推理模型 ,由此也有网友表示: R1在函数调用上表现仍欠佳,而且在这项研究里甚至没有针对这一点进行微调。但即便如此,只要给它搭配合适的框架,它在HLE这 个难度很高的测试中就能拿到32%的成绩。 虽然大家可能会习惯性地称R1为"最佳基础模型",但我觉得这其实是给V4打下了基础。我敢肯定, ...
繁荣之下,全是代价:硅谷顶级VC深入300家公司战壕,揭秘成本、路线、人才、产品四大天坑
AI科技大本营· 2025-07-07 08:54
整理 | 王启隆 出品 | CSDN(ID:CSDNnews) 投稿或寻求报道 | zhanghy@csdn.net AI 热潮的另一面是什么? 在聚光灯无法照亮的角落,那些真正用代码、数据和不眠不休的夜晚构建着AI未来的"Builder"们,他们正在经历什么?他们的"Playbook"(战术手 册)上,写下的究竟是通往圣杯的地图,还是九死一生的航海日志? 最近,硅谷顶级投资机构 ICONIQ Capital 发布了一份名为 《The Builder's Playbook》 的 2025 年度 AI 报告。他们没有采访那些在发布会上侃侃 而谈的 CEO,而是深入了战壕,对全球 300 家正在构建 AI 产品的软件公司(包括工程主管、AI 负责人和产品负责人)进行了对话。 这份长达 67 页的报告,描绘一个高歌猛进、势如破竹的黄金时代,而是用冷静到近乎残酷的数据,揭示了繁荣之下的真相: 每一步看似光明的进展,背后都标记着惊人的代价、艰难的权衡和巨大的不确定性。 报告将围绕构建者最关心的五个核心问题展开,这也是报告的五大支柱: 产品战略: 造什么? 在 AI 领域,所有构建者首先面临一个根本性的身份选择题: 你是 ...
AI智能体开发指南(2025版)
3 6 Ke· 2025-07-06 23:09
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:2025年是智能体之年。本文从理论到实践对AI智能体开发进行了全面介绍,为你从外行变成专家提供了完整指南。文章来自编译。 学习用n8n创建低代码AI智能体,实现工作自动化。 我们再也掌控不了机器了。 是它们在控制我们。 ——京特·安德斯(Günther Anders) 初识通用人工智能的那一夜 2022年12月1日, 我死死盯着屏幕,又瞥了床头柜一眼。 凌晨3:26 死寂卧室里回荡,耳鸣嗡嗡作响。 19岁熬夜本属寻常——学习、打工、派对狂欢。 但我干的不是这些。我浑身冒汗。 眼袋浮肿,但跟压力和咖啡因无关。 是因为别的什么东西... ...某种尚未命名的存在。 感觉有点像机械蝴蝶。 那或许是我第一次触到通用人工智能的火花。 我被迫开灯驱散耳鸣。 看着刚发布的ChatGPT-3.5在屏幕上逐字吐露答案。 多数人对此毫无觉察。 杨立昆(Yann LeCun)视之为随机鹦鹉。 于我而言,这是人类史上最重大的时刻。 顿悟如洪流席卷—— "x他妈的...这玩意是活的?" 一道泪痕划过脸颊。 我凝视着空无一物的镜 ...
技术选择背后的用户逻辑:美图的垂类模型思考
AI前线· 2025-07-06 04:03
作者 | 曲晓超 策划 | 罗燕珊 在视觉 AI 快速演进的当下,从底层算法到场景落地,技术与用户需求之间的连接正变得愈发紧密。 不同于一味追逐"通用大模型"趋势,美图选择聚焦于多个细分视觉场景,通过垂类模型深入挖掘用户 价值,实现精准响应与产品化落地。 InfoQ:美图选择在多个细分视觉场景上部署垂类模型,而不是一味追随通用大模型路线。这个选择 背后的判断标准是什么?您怎么看垂类模型的长期价值? 围绕垂类模型的价值判断、视觉 AI 的产品演进、AI 工作流的构建机制以及未来图像智能化的新趋 势,日前 InfoQ 与 美图公司高级计算机视觉专家曲晓超 进行了简单交流,了解其背后的技术选择与 实践路径。 8 月 22~23 日的 AICon 深圳站 将以 "探索 AI 应用边界" 为主题,聚焦 Agent、多模态、AI 产品设计 等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自头部企 业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更 多可能,发掘 AI 驱动业务增长的新路径! 曲晓超: 根据用户需求迭代模型能力和产品功能,打造真正落地的 ...
北极光创投林路:AI竞争从“技术领先”转向“产品体验”
Tai Mei Ti A P P· 2025-07-03 09:52
北极光创投合伙人:林路 核心观点: 1、技术发展并非一直呈指数级增长,在初期快速突破后会趋缓。 2、基础模型差距缩小,行业竞争的焦点就会从"技术领先"转向"产品体验",而这正是创业公司大展身 手的窗口期。 3、一个产品未能构建足够强的数据壁垒或用户体验护城河,它就极易被基础模型整合、甚至直接取 代。 4、AI并不会改变人类的根本需求,但它有能力重塑服务的实现方式,甚至重构服务逻辑的能力,带来 更丰富的互动形式和更强的系统延展性。 本文内容源于北极光创投近期的一次闭门会议。林路先生(北极光创投合伙人)分享了他对 当前AI的看法洞见。林路先生于2012年加入北极光,已在传统互联网与移动互联网领域深 耕14年,积累了丰富的经验。他参与投资及投后管理的项目众多,包括元保(YB)、 XSKY、VIPKID、火花思维、棕榈大道、观脉科技等。 在讨论人工智能之前,我们有必要先理解两条至关重要的曲线。 长期以来,许多人受到互联网时代"指数级增长"神话的影响,误以为技术演进必然是持续加速的,就如 左图中那条虚线所示。 同时,随着 DeepSeek 的开源策略,以及阿里"千问"等国产模型的陆续上线,基础模型之间的差距进一 步缩小 ...
ChatGPT诞生内幕大曝光!发布前一晚还在纠结
量子位· 2025-07-03 00:45
纳尼??原来"ChatGPT"这个名字,直到发布前一晚才确定下来。 而且当时OpenAI非常犹豫要不要发这个模型,因为据称Ilya十次测试该模型,但仅有约一半的回答被团队认可。 一水 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT诞生内幕 最新大曝光: 不过发布后,ChatGPT简直一炮而红—— 第1天数据出来后,团队开始怀疑"是不是搞错了";第2天,网上的讨论进一步扩大;才到了第3天,团队就意识到这个模型真·火了;并且进入 第4天,他们意识到ChatGPT将改变世界。 以上消息均来自OpenAI最新播客,爆料人分别为Mark Chen (中间,OpenAI首席研究官) 和Nick Turley (左一,ChatGPT负责人) , 都是在OpenAI工作多年的一线负责人。 除了大谈特谈ChatGPT崛起之路,他们还分享了OpenAI在图像生成以及代码方面的历史进程,并且还总结了OpenAI的产品开发哲学…… 虽然节目整整有1小时,但正如网友所言,整个节奏恰到好处,他们以引人入胜的方式为大家展现了ChatGPT以及OpenAI 鲜为人知的一面 。 据Nick Turley回忆,ChatGP ...
独家:HeyGen ARR 破 8000 万美金,Benchmark 又投了一位华人创始人
投资实习所· 2025-06-30 09:51
去年 6 月份,HeyGen 正式以 5 亿美金估值完成由 Benchmark 领投的 6000 万美金 A 轮融资,当时其公 布的 ARR 为 3500 万美金《 3500 万美金 ARR,什么驱动了 HeyGen 的新一轮快速增长? 》。 之后基本上就没有公布除了产品更新以外的其它数据了,不过我最新了解到的信息是, HeyGen 的 ARR 已经达到 8000 万美金,今年有望突破 1 亿美金,团队 100 人左右 。 由于公司一直盈利,据说 HeyGen 上一轮融的钱基本上都在银行里吃利息。这和 Benchmark 投资的 AI 招 聘平台 Mercor 类似,已经有投资人给 Mercor 报价 100 亿美金估值,但是被创始人拒绝,原因是公司本 身盈利,融资过程太分心《 拿 6000 万美金的 AI 语音产品在 VC 圈火了,Mercor 最新估值 100 亿美金 》。 按照最新的营收来估算,HeyGen 估值超过 10 亿美金应该很正常了。根据 HeyGen 最新提供的信息, 目 前其全球用户超过了 1500 万,付费用户则超过了 10 万,其中企业客户 4.5 万 ,涵盖了多个行业,比方 说欧洲的 ...
10 人 1600 万美金 ARR,华人团队 OpenArt 用了这 11 个 AI 技术栈
投资实习所· 2025-06-29 11:53
华人团队做的 OpenArt,在 10 人团队的情况下已经将 ARR 做到了 1600 万美金,其 CEO Coco Mao 陆 陆续续分享了不少经验,这几点我觉得挺有价值: 1.定位:如何找准自己的定位 早期,OpenArt 面临的问题是定位:在一个快速演进的市场中,如何找到自己的定位?当时的 AI 图像生 成市场群雄并起——Midjourney 凭借其艺术化的输出赢得了设计师的青睐,DALL-E 以技术实力著称,而 无数新创公司都在争夺这个看似无限大的蛋糕。 最初的几个月里,我们每天都在问自己同一个问题:OpenArt 与 Midjourney 或 Ideogram 有什么不 同?说实话,在核心功能和技术层面,所有产品都非常相似。 从表面看,OpenArt 确实很难与竞争对手区分开来——都提供文本到图像的生成功能,都使用类似的 AI 模型,都面向创意工作者。但很快她意识到, 真正的差异化往往不在于技术本身,而在于用户体验和使用 场景的精准把握。 经过几个月的探索和用户反馈,OpenArt 团队确定了三个核心用户群体: 2.增长:SEO 驱动的爆发式增长 到 2024 年底,OpenArt 已经在 AI 图 ...
中石化申请地震处理工作流道头字数据流转方法和装置专利,实现了工作流中模块最新道头字信息的流转
Sou Hu Cai Jing· 2025-06-11 03:06
金融界2025年6月11日消息,国家知识产权局信息显示,中国石油化工股份有限公司;中石化石油物探技 术研究院有限公司申请一项名为"一种地震处理工作流道头字数据流转方法和装置"的专利,公开号 CN120125000A,申请日期为2023年12月。 专利摘要显示,本发明涉及地震处理系统工作流数据流转领域,具体公开一种地震处理工作流道头字数 据流转方法和装置,该方法包括:创建全局道头字内存管理对象;基于全局道头字内存管理对象对工作 流中每个模块对象、模块之间关系、相应模块与对应的道头字之间关系进行动态的内存管理;动态扩充 道头字并更新;动态获取到相应模块的最新道头字信息,进行相关显示或应用计算。本发明提出的地震 处理工作流道头字数据流转方法,通过设计一个全局的道头字内存管理数据结构,实现了对模块关系的 动态管理记录,实现了工作流中模块最新道头字信息的流转,有效的满足了处理业务流程对道头字的动 态变化流转需求。 中石化石油物探技术研究院有限公司,成立于2022年,位于南京市,是一家以从事开采专业及辅助性活 动为主的企业。企业注册资本133611.989369万人民币。通过天眼查大数据分析,中石化石油物探技术 研究院有 ...
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
Di Yi Cai Jing· 2025-05-26 03:02
"瑕疵非常多,也很贵。" "如果AI生成的角色拒绝相信他们是AI生成的,会怎么样?" 近日,海外博主用谷歌最新视频模型Veo 3生成的一些人物视频火了。在这些视频中,有一群人集体高呼抗议"We're not prompts(我们不是提示词)",还有 一位男士举着手机自拍,背景是美妙的高山峡谷,他指着身后,"你想说我背后的完美创造物,仅仅是0和1的结果,一串二进制代码,再无其他?这不合 理。" 当然台词和剧本是人创作的,但由AI生成的这些人物和场景都极具真实感,无论是光线在人脸上投下的阴影与高光,还是人物的长相、口型,在阳光下眯 起眼睛的神态都极为自然。配合Veo 3新的原生音频生成功能,人们再一次惊呼"真实不存在了"。 事实是否真的如此,视频生成的GPT时刻终于来了吗?第一财经记者采访的Veo 3的使用者们并不这么认为。AI Talk主理人、AIGC创作者汗青提到,Veo 3 确实是很好的技术,但并没有网传那么夸张,例如视频生成质量有提升但不惊艳,价格不低,现阶段对实际生产帮助还不大。 AIGC创作领域的KOL@尾鳍Vicky对第一财经表示,Veo 3的文生效果是很好,但图生效果与国内第一梯队产品差不多,而在 ...