Workflow
Founder Park
icon
Search documents
OpenAI科学家姚顺雨:o3发布、RL迎来新范式,AI正式进入下半场
Founder Park· 2025-04-17 12:12
有评论称这篇文章是 「 Bitter Lesson」级别的存在,或许是因为和 「 Bitter Lesson」类似,这篇文章也试图从 high level 指出 AI 研究中一种思维范 式的彻底改变。 「 Bitter Lesson 」启发了大家从 「 人类指导 AI」转向算力和数据的 scaling,而 The Second Half 告诉大家 在 RL 全面到来时,我 们应该彻底重新思考问题定义和真实用例的 evaluation。 姚顺雨本科毕业于清华姚班,是姚班联席会主席,2024 年从 Princeton 博士毕业后加入 OpenAI 担任 Research Scientist,参与了 OpenAI 的 Computer-Using Agent,Deep Research 等多个产品项目。他是 Agent 领域的最前沿探索者,这个领域不少最重要的 framework 和 benchmark 都来自 他 Phd 期间的工作:ReAct、Tree of Thought、SWE_Bench。 这篇博客主要内容来自姚顺雨在 CS 224N 和 Columbia 大学所做的演讲。 Founder Park 正在 ...
AI创业,为什么小红书是「冷启动」的第一步?
Founder Park· 2025-04-16 12:56
工作近十年,他第一次冒出一个想法,能不能开发一款帮大家晒太阳的 app?他曾在 2015 年和 2018 年分别接触过国内不同的独立开发者群 体,一直想像他们一样做一款自己的产品。 2024 年,Shawn 从前司离职,来到杭州良渚周边,成为了一名独立开发者。 近一两年,良渚聚集了众多像他一样的独立开发者,掀起了一阵新的独立开发热潮。 「这两年做独立开发的人一下子多了好几倍,感觉这个圈子一下子就热起来了。」多位开发者告诉极客公园。原因在于,AI 技术大幅降低了开 发门槛、提高了开发效率,让越来越多人能成为开发者,也让产品开发更敏捷、多元、有想象力。 2022 年,由于大厂工作压力大,开发者 Shawn 已与焦虑症对抗了三年。某次,在阳台晒太阳的经历让他感到治愈,之后他每天出门晒太阳,一年后焦虑 症状不再出现。 花了三个月时间开发之后,Shawn 把产品内测的内容发到小红书上。出乎意料的是,第一条笔记点赞数就破 3000,一周后内测用户就达到了八 百。上线不到 2 个月,Shawn 在小红书上收获了两万个用户。 Shawn 发布的小红书笔记 | 图片来源:小红书 Shawn 并非个例,过去一年里,相当一批开发者 ...
黄仁勋「组局」,具身智能的核心玩家们聊了聊人形机器人的落地与未来
Founder Park· 2025-04-16 12:56
文章转载自 「 Linguista」 今年的 GTC 大会,英伟达发布了通用机器人模型 GR00T N1,老黄特别提到未来重点关注的趋势是「Physical AI」(物理 AI)。 不仅如此,老黄还把当下机器人领域的核心玩家都喊了过来,针对人形机器人领域当下的技术路径、数据问题以及通用模型和通用机器人等问题进行了深 入探讨,有不少很有价值的观点。 嘉宾阵容很强大,1X、Skild AI、Agility Robotics、Boston Dynamics……堪称具身智能领域的「华山论剑」。 嘉宾介绍: TLDR: Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核 后工作人员会拉你入群~ Bernt Børnich,人形机器人创企 1X 的创始人兼 CEO。1X 致力于构建完全自主的人形机器人。此前曾推出专注于家庭场景的人形机器人 NEO。 Deepak Pathak,具身智能创企 Skild AI 的 CEO 兼联创。Skild AI 致力于打造机器人通用「大脑」。此前曾推出曾推出可扩展的机器人基础模型「Skild B ...
万字解读OpenAI产品哲学:先发布再迭代、不要低估模型微调和评估
Founder Park· 2025-04-15 11:56
今天凌晨, OpenAI 发布了新模型 GPT-4.1 ,相对比 4o,GPT-4.1 在编程和指令遵循方面的能力显 著提升,同时还宣布 GPT-4.5 将会在几个月后下线。 不少人吐槽 OpenAI 让人迷惑的产品发布逻辑——GPT-4.1 晚于 4.5 发布,以及混乱的模型命名,这 些问题,都能在 OpenAI CPO Kevin Weil 最近的一期播客访谈中得到解答。 在访谈中,Kevin Weil 分享了 OpenAI 在产品方面的路线规划,以及所拥护的产品发布哲学「迭代 部署」,对于近期火热的 4o 图片生成功能,也做了内部的复盘。 Kevin Weil 表示,「我们尽量保持轻量级,因为它不可能完全正确。我们会在半路放弃一些不正确 的做法或研究计划,因为我们会不断学习新的东西。 我们有一个哲学叫做迭代部署,与其等你完全 了解模型的所有能力后再发布,不如先发布,即使不完美,然后公开迭代。 」 背景:Kevin Weil 是 OpenAI 的首席产品官,负责管理 ChatGPT、企业产品和 OpenAI API 的开发。在加入 OpenAI 之前,Kevin 曾担任 Twitter、Instagram ...
AI活动公告板:4月份这些AI活动值得参加
Founder Park· 2025-04-15 11:56
时间地点: 4 月 20 日、上海线下 活动介绍: 对于所有在 AI 领域的创业者和投资人来说,这开年的「百日剧变」带来了全新的机遇与挑战,重塑了整个市场的格局。邀请你来到我们在上 海漕河泾开发区发起的 AI Hacker House,参加这场探讨行业变革的沙龙。 面向人群: AI 从业者 / 开发者 / 投资人 / 产品经理 与 AI 共处72小时,没有食物、水、手机,会发生什么 | 寻找「赛博鲁滨逊」 主办方: 五源资本 Agent 依旧是本月热点,Gemini-2.5-Pro 好评越来越多,OpenAI 发布了他们的新模型GPT-4.1,上下文更长了,据说编程能力很强。 本月 AI 热点依旧很多,值得参与的活动也有不少。 「AI 活动公告板」第二期,我们整理了 4 月下半月值得参与的活动,更多活动点击「阅读原文」。 本月值得关注的 AI 活动: AI 开年百日剧变:DeepSeek、Manus、GPT-4o之后,2025创投路在何方? 主办方: 十字路口 活动介绍: 现场由阿里通义实验室技术专家、魔搭社区模型服务技术专家王兴军,真格基金投资总监秦天一,欧莱雅中国信息技术部门专家与大家展开 深度交流。 面 ...
OpenAI自曝GPT-4.5训练内幕:数据效率是关键,预训练仍然有用
Founder Park· 2025-04-14 11:34
智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。 在 GPT-4.5 发布 1 个多月后,Sam Altman 与 GPT-4.5 的 3 位核心技术人员进行了一场 45 分钟的高信息量对谈,首次披露了这款模型 研发耗时严重超 期 、 计算集群频繁故障 、 提升路径难以预测 等诸多不为人知的细节。 对于今后的模型训练范式,乃至如何重新理解 Scaling Law、以及数据效果,都有不少启发。 参与本次对谈的 3 位 OpenAI 员工分别为 Alex Paino(负责 GPT-4.5 的预训练机器学习算法)、Amin Tootoonchian(OpenAI 首席系统架构师)与 Daniel Selsam(研究数据效率与算法)。 以下文章来源于智东西 ,作者陈骏达 陈家阳 智东西 . TLDR Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后 工作人员会拉你入群~ 进群之后,你有机会得到: 01 GPT-4.5两年前已启动, 项目耗时远超预期 ...
The Information爆料:苹果的大公司病,是怎么搞砸了AI版Siri的?
Founder Park· 2025-04-14 11:34
科技媒体「The Information」近期发布了一篇关于苹果新版 Siri 延期发布内幕的评论文章,直指苹果 Siri 项目推迟发布背后隐藏的诸多问题。 模型技术路线摇摆、内部团队冲突、高层犹豫不决等,Siri AI 的失败,可以说是完整体现了一个公司面对新技术的「大公司病」。 文章基于 The Information 的文章编译,略有调整。 TLDR: 苹果 Siri 部门高级总监 Robby Walker 对此的说法是, 「但这也只是一个目标,并不意味着那时就会发布」。 换言之,关于新版 Siri 发布时间,最新的答案是: 苹果自己也不知道。 背后到底发生了什么?为何苹果在 AI 战略上进度这么缓慢,已经落后在其他手机品牌之后? 在 WWDC 2024 上预告的新版 Siri,迄今仍未发布。甚至有消息称,可能会延期到今年的 iOS 19 版本中才会正式发布。 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核 后工作人员会拉你入群~ 进群之后,你有机会得到: 01 云端结合,还是一个云端模型 从大小模型协作到 ...
a16解读AI数字人:技术基本Ready、应用层即将爆发,下一个十亿级赛道
Founder Park· 2025-04-11 17:40
文章转载自「RTE开发者社区」。 过去几年,AI 已经能生成逼真的图片、视频和声音,悄然通过视觉和听觉的图灵测试。但 2025 年最令人激动的突破之一,毫无疑问将是把这些方案 集于一体的 AI 数字人(Al Avatar)。 结合 GPT-4o 吉卜力风格生成和 Hedra 制作的主播数字人,在 X 上获得了 231 万次观看。 今年 2 月,字节跳动推出的 OmniHuman-1 模型在全球 AI 圈掀起了巨浪。仅需一张照片和一段音频,即可生成具有动态背景、支持全身动作,且口 型同步的逼真 AI 视频。 这些不再令人感到「恐怖」的 AI 角色,正以惊人的速度走出「恐怖谷」,并开始全面渗透到内容创作、广告营销、企业培训等多个领域。这不仅是 人工智能技术的一次飞跃,更是内容产业的一次重要转变。 近期,a16z 发布了关于 AI Avatar 数字人的最新报告,详细介绍了数字人的研究进展、构成要素以及未来发展应用。报告中,Agora、ElevenLabs、 字节跳动的 OmniHuman 等技术被列为核心要素技术能力。 报告预测:「底层模型的技术水平已经显著提升,AI 数字人应用层将迎来快速发展的机遇,我们预计该 ...
Anthropic工程师教你怎么做AI Agent:不做全场景、保持简单,像Agent一样思考
Founder Park· 2025-04-11 11:11
文章转载自「INDIGO 科技加速站」 Anthropic 工程师 Barry Zhang 在 AI Engineer 工作坊上的一个分享 "如何构建有效的 Agent",其中印象最深的一个观点: Don't build agents for everything ,反过来理解就是别做什么都能干的 Agent,那是我们大模型要干的事情 构建有效 Agent 的三大要点: Barry 主要负责 Agentic System,演讲内容基于他和 Eric 合著的一篇博文,下面详细总结他们的核心观点,以及对 Agent 系统的演进和未来的思考。 Agent 系统的演进 1. 简单功能(Simple Features): 起初是简单的任务,如摘要、分类、提取,这些在几年前看似神奇,现在已成为基础。 2. 工作流(Workflows): 随着模型和产品成熟,开始编排多个模型调用,形成预定义的控制流,以牺牲成本和延迟换取更好性能。这被认为是 Agent 系统的前身。 3. Agent: 当前阶段,模型能力更强,领域特定的 Agent 开始出现。与工作流不同,Agent 可以根据环境反馈自主决定行动路径,几乎独立运 作。 4 ...
福布斯2025 AI 50榜单:AI Agent全面崛起,应用层才是2025真正的主战场
Founder Park· 2025-04-11 11:11
《福布斯》发布了 2025 年的年度 AI 公司 50 榜单,该榜单由福布斯、红杉资本和 Meritech Capital 联合制作。 一句话总结趋势: AI Agents Move Beyond Chat。 前几年,AI 应用主要还是用于回答问题或根据指令生成内容,而今年的创新则侧重于 AI 实际完成工作。AI 正从简单地响应提示,转向解决问题和完 成整个工作流程。 红杉资本给出的几点核心观察: | 公司 | 行业/业务 | 融资 | 成立年份 城市 | 国家 | | --- | --- | --- | --- | --- | | Abridge | 医生用 Al 笔记工具 | $458 M | 2018 旧金山 | 美国 | | Anthropic | Al 模型开发商 | $17 B | 2020 旧金山 | 美国 | | Anysphere | AI 编程工具 | $176 M | 2022 旧金山 | 美国 | | Baseten | AI 应用部署软件 | $135 M | 2019 旧金山 | 美国 | | Captions | 视频编辑器 | $100 M | 2021 纽约 | 美国 | | ...