Workflow
Data Efficiency
icon
Search documents
Karpathy盛赞,啥都没有的创业公司刚融了1.8亿美元,要用小数据造强智能
机器之心· 2026-01-29 10:26
你想象中真正的 AI 是什么样子的? 至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。 问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗? 当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超 任何一个人类个体一生所能接触的总和。 AI 需 要整个互联网来学 习,而人类只需要一个童年。 人类在成年之前,所接触的语言、文本与符号,顶多只有几十亿 token,相差几个数量级。 正是从这个问题出发,一家几乎 没有产品、没有盈利 、也不急于商业化的 AI 创业公司,从 GV、Sequoia 和 Index 拿到了 1.8 亿美元融资 ,并获得了 Andrej Karpathy 的公开力挺。 它的名字,叫 Flapping Airplanes。 Flapping Airplanes 是一家基础 AI 研究实验室,专注于解决「数据效率」这一核心问题 ,并正在探索一些看似怪异、但可能至关重要的新思路 —— 从重新思考损 失函数,到甚至质疑和重构梯度下降本身。该公司的研究团队成员中包括 IMO、 ...
OpenAI自曝GPT-4.5训练内幕:数据效率是关键,预训练仍然有用
Founder Park· 2025-04-14 11:34
智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。 在 GPT-4.5 发布 1 个多月后,Sam Altman 与 GPT-4.5 的 3 位核心技术人员进行了一场 45 分钟的高信息量对谈,首次披露了这款模型 研发耗时严重超 期 、 计算集群频繁故障 、 提升路径难以预测 等诸多不为人知的细节。 对于今后的模型训练范式,乃至如何重新理解 Scaling Law、以及数据效果,都有不少启发。 参与本次对谈的 3 位 OpenAI 员工分别为 Alex Paino(负责 GPT-4.5 的预训练机器学习算法)、Amin Tootoonchian(OpenAI 首席系统架构师)与 Daniel Selsam(研究数据效率与算法)。 以下文章来源于智东西 ,作者陈骏达 陈家阳 智东西 . TLDR Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后 工作人员会拉你入群~ 进群之后,你有机会得到: 01 GPT-4.5两年前已启动, 项目耗时远超预期 ...