Workflow
Scaling
icon
Search documents
Tencent says it has enough high-end chips to train AI for 'generations' even if the US cuts it off
Business Insider· 2025-05-15 04:30
The Chinese tech giant Tencent said it has a "pretty strong stockpile of chips" to tide it through America's chip sale restrictions. The company's president, Martin Lau, was speaking to investors during an earnings call on Wednesday when he was asked how Tencent would deal with US chip restrictions.Lau said "it's a very dynamic situation" that Tencent is managing, and it's trying to "figure out the right solution" to make sure its AI strategy "can still be executed." Lau told investors that Tencent can ...
10万美元成本训练的小模型,在特定任务超越GPT-4o,延迟低99倍
3 6 Ke· 2025-05-14 09:45
现有的SOTA级别大语言模型固然拥有较强智能,在部分任务上达到或超过了人类的水准,但他们的参数尺寸动辄达到数千亿甚至万亿,无论是训练,部 署,还是推理,都成本高昂。对于企业和开发者来说,这些SOTA模型在一些相对简单,但需要大规模和高并发的任务上,未必是综合成本及性能的最优选 择。 一家叫Fastino的早期初创公司看到了这个痛点,使用低端游戏GPU,以平均不到10万美元的成本,训练出一系列称为"任务特定语言模型"(TLMs,Task- Specific Language Models)的小型模型,能够在特定任务上性能媲美大型语言模型,并且推理速度快99倍。 近日,Fastino获得由Khosla Ventures领投的1750万美元种子轮融资,Insight Partners,Valor Equity Partners,以及知名天使投资人前Docker首席执行官Scott Johnston和Weights & Biases首席执行官Lukas Biewald参与。在2024年11月,Fastino获得M12(微软旗下)和Insight Partners领投的700万美元前种子轮融资, 累计融资近2500万美 ...
2025 大模型“国战”:从百模混战到五强争锋
佩妮Penny的世界· 2025-05-13 10:24
大家好,我是佩妮。 AI 2.0 是最近几年投资行业最热赛道,没有之一。 我也一直在关注行业的进展和 AI 相关资本市场的变化。 如果到了 2025 年,你对 AI 大模型的认识还停留在 "AI 六小虎", 那已经远远过时了。 在 ChatGPT 爆火 2 年多后,咱们是时候一起从资本市场观察的视角,来聊聊现在国内AI 基座模型公司的格局演变,以及未来可能的变化趋 势。 本文得到了一些AI 行业和投资人朋友的信息帮助,非常感谢~ 1)AI六小虎,一场关于牛人和朋友圈的资本局; 六小虎中,除了 2019 年成立的智谱,和 2021 年创立的 Minimax,其他公司都是在 2023 年上半年成立的,直接的导火索就是 22 年底 ChatGPT 的横空出世。 不到两年,这几家公司在一级市场的估值就都超过了百亿人民币,领头的智谱 估值超过 250 亿人民币 。 考虑到这些公司的用户规模,收入进展(最多营收不过数亿,没有利润),相比估值的差距,这个火箭跃升的速度,在整个创投历史上都罕 见。 当时虽然也有百模大战之称,但是因为大模型的烧钱特性,能上牌桌的都不是无名之辈。 其中, 零一万物 核心团队已经并入阿里云,明确" ...
超过霉霉,她拿下全球最年轻女富豪
华尔街见闻· 2025-05-11 11:48
以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识和洞见,在私募股权投资行业和创新商业领域拥有权 威影响力。官网:www.chinaventure.com.cn 这似乎是出人意料的 , 一时间"Lucy Guo是谁"成了各大媒体的头版标题 。的确,即便是Lucy最为人熟知的身份——Scale AI的联合创始人,也常 常是作为该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后,她向《福布斯》透 露道。 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 辍学、创业、投资, 不被定义的"天才少女" 图片来源福布斯 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者,年仅30岁的Lucy Guo。 | 姓名 | 年龄 | 身家 | 国籍 | 财富来源 | | --- | --- | --- | --- | --- | | Lucy Gu ...
早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗?
机器之心· 2025-05-10 13:10
本期通讯总计 21681 字,可免费试读至 6% 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 机器之心PRO · 会员通讯 Week 19 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗? 什么是Native多模态模型?相较目前流行的「晚融合」方案,「早融合」的Native多模态模型的训练过程有何不同?苹果公司 近期发布的「NNM」技术报告中,有哪些反直觉的新发现?近期业内有哪些获得较好表现的多模态模型?「早融合」是否正在 成为主流?... 2. Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读 Dario Amodei 为什么说「AI 的未来是 Agents」?数据的「Scaling Law」依然乐观?围绕 Agents 进行数据创新?MCP和 A2A范式下,企业怎样维护数据系统安全?Agents产品迭代的关键缺口如何突破?人类如何把握 AI 技术的双刃剑?... 本期完整版通讯含 2 项专题解读 + 29 项 AI ...
Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读
机器之心· 2025-05-10 06:07
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 Anthropic 和 Databrick 近期以「人工智能的未来:面向各领域的专用 Agent」为主题的线上峰会。两家公司的 CEO Dario Amodei 和 Ali Ghodsi 在其中的对谈环节分享了有关 Agent 的未来、Amodei 此前的博文以及双方 所展开的相关合作等话题。 目录 01. 在谈论Agents之前,人们应该先关注什么? Dario Amodei 在《Machine of Loving Grace》中写了什么?为什么说「AI的未来是Agent」?... 02 . 数 据价值无可替代,但数据治理风险如何破解? Anthropic 和 Databrick 如何围绕数据 Agent 数据进行创新?人类如何把握 AI技术的双刃剑?... 03. AI 应用快速迭代的阻塞要靠 MCP 跨越? Agents 产品迭代的关键缺口如何突破?MCP 和 A2A 范式下,企业怎样维护数据安全?... 04. Anthropic 为何仍乐观看待「Scaling Law」? 3、Ghodsi 进而提出「AI 技术要多久才能 ...
她超过霉霉,拿下全球最年轻女富豪
36氪· 2025-05-09 12:37
以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识和洞见,在私募股权投资行业和创新商业领域拥有 权威影响力。官网:www.chinaventure.com.cn 持股公司估值突破1800亿。 文 | 张雪 来源| 投中网(ID:China-Venture) 封面来源 | 《福布斯》杂志网站报道截图 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者,年仅30岁的Lucy Guo。 这似乎是出人意料的,一时间"Lucy Guo是谁"成了各大媒体的头版标题。的确,即便是Lucy最为人熟知的身份——Scale AI的联合创始人,也常常是作为 该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后,她向《福布斯》透露 道。 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 辍学、创业、投资 不被定义的"天才少女" 今年30岁的Lucy出生于 ...
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
Founder Park· 2025-04-30 12:31
以下文章来源于海外独角兽 ,作者拾象 海外独角兽 . 研究科技大航海时代的伟大公司。 前段时间, OpenAI 陆续发布了 o 系列最新的两个模型 o3 和 o4-mini。其中, o3 模型 在融合了 tool use 能力后,模型表现已经覆盖了 Agent 产品常用的 use case。 Agent 产品开始分化出两类路线:一类是像 o3 那样把 tool use 通过 CoT 内化到模型中,模型可以用写代码调用的方式执行任务;另一类是类似 Manus, 把工作流程外化成人类 OS 中的 computer use。 同时,OpenAI 也已经把 Agent 产品作为了未来产品商业化收入占比的大头。 o3 这类基础大模型的 tool use 内化能力的提升,是否意味着专用 Agent 产品的技术护城河正在消失? 本篇文章针对于 OpenAI 发布的 o3、o4-mini 模型,开源的 Codex CLI,以及在 API 中使用的 GPT 4.1 进行了解读,尤其是 o3 agentic 和多模态 CoT 新能 力。 Founder Park 正在搭建「 AI 产品市集」社群,邀请从业者、开发人员和创业者,扫 ...
o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
海外独角兽· 2025-04-25 11:52
作者:cage, haozhen 我们在 2025 年 Q1 的大模型季报 中提到,在 AGI 路线图上,只有智能提升是唯一主线,因此我们持 续关注头部 AI Lab 的模型发布。上周 OpenAI 密集发布了 o 系列最新的两个模型 o3 和 o4-mini,开 源了 Codex CLI,还推出了在 API 中使用的 GPT 4.1。本文将着重对这些新发布进行解读,尤其是 o3 agentic 和多模态 CoT 新能力。 我们认为 OpenAI 在数次平淡的更新后,终于拿出了有惊艳表现的 o3。融合了 tool use 能力后,模型 表现已经覆盖了 agent 产品常用的 use case。Agent 产品开始分化出两类路线:一类是像 o3 那样把 和 o3 的发布模式一样, OpenAI 的 reasoning model 都是先训练出一个 mini reasoning 版本,再 scale 到 一个 long inference time、full tool use 能力的模型上。 而之前 GPT 模型总是先训练出最大的模型,再蒸 馏到小模型上。这个策略值得探讨其原因,我们的猜测是 RL 算法比较脆弱, ...
李建忠:大模型技术创新驱动的 AI 生态和应用演进
AI科技大本营· 2025-04-24 03:39
【导读】历经八年 AI 浪潮,从感知到生成,再到智能体时代,人工智能正以惊人速度演进。CSDN 高级副总裁、Boolan 首席技术专家李建忠,在 2025 全 球机器学习技术大会上,绘制了一幅宏大的 AI 发展蓝图,并创造性地将其与生物智能演化史进行对比,揭示了"语言"在智能跃迁中的核心地位。跟随李建 忠的思考,洞见 AI 的过去、现在与激动人心的未来。 作者 | 李建忠 出品丨AI 科技大本营(ID:rgznai100) 大家好!回想起我在 2017 年创办全球机器学习技术大会( ML-Summit ),在各位的支持下一起陪着 AI 一路走了八个年头,非常感慨。八年来,整个 人工智能领域也发生了波澜壮阔的变化。接下来我想和大家分享一下我对大模型最新发展的一些研究和思考。 我把 AI 的发展阶段和地球上从生物智能到人类智能的发展阶段做了一个对比,发现一些非常有意思的规律。大家首先来看 AI 发展的四个阶段。 第一阶段: 1940 年代开启人工智能的元年, 整个人工智能从 1940 年代图灵提出计算机理论模型和神经网络的初始构想,到 1956 年达特茅斯会议首 次提出人工智能,此后人工智能进入符号主义、行为主义 ...