Scaling Law
Search documents
对话2025最火具身智能团队:2个自动驾驶第一人带队,1.2亿美元天使融资震动江湖
量子位· 2025-03-26 10:29
衡宇 李根 发自上海 量子位 | 公众号 QbitAI 可问题是这都已经2025年了……最早出发的具身智能创业者,在3年前的时间点已经下水。进展快速的具身智能公司,也已经开启场景验证和 落地。以及具身智能领域,也从不缺天才和大牛创业者。 还有什么样的创业团队,凭什么在此时此刻搅动如此风云? 一位知情人士说,核心原因是团队豪华,堪称 梦之队 ,而且还是有过硬科技完整落地经验的工程派。也有人拿NBA篮球类比, "库里和约基 奇联手组了队,联盟大结局" ——库里是三分外线第一人,约基奇则被视为最全能的内线中锋,而这家公司背后的核心人物也是 两位自动驾 驶领域的第一人 。 据说这两人联手创业的进展传出后,获得了这样的评价: 陈亦伦带队,牛了;李震宇坐镇,稳了。 他们在上海,组建战队,取名 它石智航 TARS ,竞逐具身智能的GPT时刻。 他们创业的消息,实际流传已久,但现如今随着创纪录的1.2亿美元天使融资曝光,再也藏不住了。 中国具身智能最壕天使轮融资 它石智航(TARS) 官宣的新进展是这样的: 完成天使轮1.2亿美元融资,开启具身智能创业新征程。本轮融资由蓝驰创投、启明创投联合领投,线性资本、恒旭资本、洪泰基 ...
大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
AI科技大本营· 2025-03-25 01:45
以下文章来源于CSDN ,作者万有引力 CSDN . 成就一亿技术人 作者 | 万有引力 出品 | CSDN(ID:CSDNnews) 在过去短短的几周里,大模型赛道的信息密度飙升至前所未有的高度。DeepSeek 连续 五天开源 ,直接引发了一场复现热潮;阿里巴巴通义实验室、 腾讯相继推出面向视觉文档的 RAG 系统 ViDoRAG、新一代混元快思考模型 Turbo S ,加速了大模型的演进步伐;马斯克用 20 万张 GPU 训练出的 Grok 3 ,超越了许多业界标杆,再次验证了"大力出奇迹"的定律; Claude 3.7 Sonnet 迎来编码能力大升级,AI 编程的技术平权时代正在加速到来; DeepSeek 论文与 Kimi"撞车",越来越多公司开始布局稀疏注意力与线性注意力机制,这些技术正成为 Transformer 之后的关键探索方向;此外, Manus 模式的"虚拟机"概 念迅速走红,正在重塑大模型的运行方式... 在这场眼花缭乱的技术竞赛背后,真正值得我们关注的是什么?DeepSeek 的五连发 究竟意欲何为?在 545% 的成本利润率之下,其他大模型公司是 否也能找到盈利空间?面对行业变 ...
科技行业跟踪报告之五:英伟达GTC2025发布新一代GPU,推动全球AI基础设施建设
EBSCN· 2025-03-21 13:33
Investment Rating - Electronic Industry: Buy (Maintain) [6] - Communication Industry: Overweight (Maintain) [6] - Computer Industry: Buy (Maintain) [6] Core Insights - NVIDIA introduced the concept of Agentic AI, which represents a new reasoning paradigm that will continue to drive global data center construction. This evolution is categorized into three stages: Generative AI, Agentic AI, and Physical AI [12][13] - The global investment in data center construction is expected to reach $1 trillion by 2028, driven by the need for larger computational resources and data for training better models [2][17] - The Blackwell Ultra chip, designed for AI inference needs, will be supplied in the second half of 2025, with significant performance improvements over its predecessor [20][22] - NVIDIA's new AI inference service software, Dynamo, aims to maximize token yield in AI models and supports the development of AI agents [33][35] Summary by Sections 1. Agentic AI and Data Center Development - The introduction of Agentic AI is seen as a pivotal shift in AI technology, emphasizing autonomy and complex problem-solving capabilities [12][13] - The Scaling Law remains relevant, as it will expand to include inference and long-term reasoning, requiring substantial computational resources [14][17] 2. Blackwell Ultra Chip and Future Releases - The Blackwell Ultra chip will enhance AI performance significantly, with a 1.5 times improvement in AI capabilities compared to the previous generation [22] - The Vera Rubin series is expected to launch in 2026, featuring advanced architecture and enhanced memory capacity [22][23] 3. Quantum-x CPO Switch Launch - NVIDIA plans to release the 115.2T 800G Quantum-x CPO switch in the second half of 2025, which will offer substantial improvements in energy efficiency and network resilience [26][29] 4. Introduction of Dynamo and AI Frameworks - Dynamo will facilitate efficient AI inference by optimizing GPU resource utilization across different processing phases [33][35] - NVIDIA also introduced the AI-Q framework to enhance AI agents' reasoning capabilities and reduce development costs [37] 5. Investment Recommendations - The report suggests focusing on companies within the electronic communication and computer industries that are positioned to benefit from the advancements in AI and data center infrastructure [45][46] - Specific companies to watch include those involved in AI computing, robotics, and data platforms, highlighting a diverse range of investment opportunities [46][47]
DeepSeek重构算力基建长期价值的认知
Guotai Junan Securities· 2025-03-14 07:10
DeepSeek 重构算力基建长期价值的认知 [Table_Industry] 计算机 股票研究 /[Table_Date] 2025.03.14 [Table_Invest] 评级: 增持 上次评级: 增持 | [table_Authors] 李博伦(分析师) | 伍巍(研究助理) | 钟明翰(研究助理) | | | --- | --- | --- | --- | | 0755-23976516 | 021-38031029 | 021-38031383 | | | libolun@gtjas.com | wuwei028683@gtjas.com | zhongminghan029903@gtjas.com | [Table_Report] 相关报告 | | 登记编号 S0880520020004 | S0880123070157 | S0880124070047 | | 本报告导读: 市场低估了 DeepSeek 生态对算力需求的放大效应,我们预计仅其推理端就将产生 近百万 PFLOPS 的算力需求。精度支持及通信效率率先突破的国产 AI 芯片厂商将 获得显著的发展机会。 投资要点: 计算机《AI 应用 ...
晚点播客丨MiniMax 闫俊杰聊大模型 2024:一个非共识判断引起的回声
晚点LatePost· 2025-01-22 13:56
"更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。" 文丨程曼祺 * 头图:Dota 2019 国际邀请赛决赛(TI9)中,OG 战队的 Ana 使用 IO(小精灵,图中球形发光体)的经典作战,OG 在 TI9 中夺冠。为什么用这个图?播客里有 答案。 ▲扫描上图中的二维码,可收听播客。《晚点聊 LateTalk》#99 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 上周四,我们发布图文访谈:《 晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI 》,这是这次访谈的音频版。 闫俊杰的一些 "非共识" 判断,引起不少讨论。 他认为,模型能力和用户规模并不是直接的飞轮关系:"更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好 的模型。" 而今天(1 月 22 日)字节跳动发布 Doubao-1.5-pro 模型的技术报告里则提到:"依托字节在推荐、搜索和广告领域的 AB Test 经 验,研发了基于 ...
她为何被雷军挖角
投资界· 2025-01-21 07:35
以下文章来源于南风窗 ,作者朱秋雨 南风窗 . AI小厂崛起。 作者 | 朱秋雨 来源 | 南风窗 (ID:shangyejingxiang) 2024年末,一个中国AI小厂,凭借过硬的技术,获得了全球铺天盖地的关注。 圣诞节过后,海外社交媒体以及技术论坛Github都在讨论一个最新发布的开源大模型, DeepSeek-V3。它被外国网友冠以名号——"来自东方的神秘力量"。 多个评测报告里,DeepSeek-V3在世界开源模型之中处在第一梯队,超过扎克伯格的 LLaMa 3.1。拿它比GPT-4o以及Claude 3.5两个最顶尖大模型也毫不逊色,甚至, 其在数学推理、代码生成和长文本处理等指标上,表现更强。 这还不是中国AI公司DeepSeek(中文名:深度求索)全部的"拿手好戏"。更让美国硅 谷等同行摸不着头脑的是,DeepSeek公布的53页技术报告显示,其训练顶尖大模型只 用了2048张H100的GPU集群,花费53天,共计耗费557.6万美元。有专业人员指 出,同等水平之下,世界AI大厂至少要用1.6万张以上的GPU,有的甚至需要10万张 GPU并行训练。 OpenAI早期成员安德烈·卡帕西感慨,D ...
AI正在诞生一个万亿级公司
投资界· 2024-12-25 08:24
人工智能"加减乘除"。 报道 I 投资界PEdaily 2 0 24年12月1 0 - 11日,由中共重庆市委金融委员会办公室指导,清科创业、投资界主 办,重庆渝富控股集团联合主办的"第二十四届中国股权投资年度大会"走进西部金融中 心重庆。作为股权投资行业晴雨表,本次大会将以"万象耕新"为主题,回顾行业风云, 重塑格局策略,探索价值发现,持续为中国股权投资行业注入力量。 本场《人工智能+-×÷》圆桌论坛,由光速光合合伙人 孙健 主持,对话嘉宾为: 真格基金 合伙人 刘元 啟赋资本 合伙人 宋昶 广州基金 首席投资官 易沙 合力投资 管理合伙人 张敏 以下为对话实录, 经投资界(ID:peda il y 2 0 1 2)编辑: 孙健 :很荣幸主持这场圆桌讨论,主题是人工智能加减乘除,为什么是加减乘除?我在 想,是不是可能半年前人工智能还处于(X),发展到今天大家面临着各种各样的疑问 和困惑,就演变成了一个加减乘除,不知道该选择哪一个符号。在开场前,还是请大家 先自我介绍。 张敏 :我来自合力投资,主要关注早期投资,2001年进入到天使投资,现在做了2 3年。 易沙 :广州基金是由广州市委、市政府为推进广州产业转 ...
晚点播客丨OpenAI o1 如何延续 Scaling Law,与硅基流动袁进辉聊 o1 新范式
晚点LatePost· 2024-09-20 15:22
"如果每天和开发者打交道,你不会感觉这个行业停滞或变冷。" 文丨程曼祺 贺乾明 扫描图中右下角二维码,可收听播客。* 这是《晚点聊 LateTalk 的第 80 期节目,欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目,在文字报道之外,用音频访谈形式捕捉商业世界变化的潮流和不变的逻辑,与这 其中的人和故事。 OpenAI 发布新模型 o1 后的第二天,我们邀请了硅基流动创始人袁进辉与我们分享了 o1 的技术意义,也讨论了今年 1 月至今,袁进辉观察 到的 AI 开发者社区变化。 o1 的一个重要变化就是增加了分配给推理(inference,即大模型的使用)阶段的算力,推理阶段计算(test-time compute)重要性提升。 而袁进辉今年初创立的硅基流动(SiliconFlow)就是一家做推理加速优化的 AI Infra(中间层软件)公司。他是一位连续创业者,曾在 2017 年创立一流科技(OneFlow),在 2023 年加入王慧文组建的大模型创业公司光年之外,成为联合创始人。(袁进辉的上两段创业故事,可 听 ...
C.AI 被收购的宿命论与万恶的 Scaling Law | 42章经
42章经· 2024-08-18 13:52
聊 C.AI 不能只聊 C.AI,更不能只聊陪聊类产品,因为这些都是表象。如果从背后更深一层的商业逻辑来看,我们就会发现 C.AI 被收购几乎是一种必然,这就是 典型的个体在整个商业世界运作规则之下的命运轨迹的缩影。 但同时,你会面临的问题就是,我该如何把陪聊类产品包进我的模型故事里。 那在 23 年市场最火热的时候,如果你是 Noam,有那么好的背景和市场机遇,你在定位自己的时候,会说自己是一家应用公司,还是说自己是家模型公司呢? 当然是模型公司,不然应用做得再好,凭什么能一上来就估值十亿美金?以及有一个 AGI 的大故事难道不比做一款厉害的陪聊产品更性感吗?何况有这么好的背 景,不做大模型不就浪费了嘛。 到了 2023 年初,C.A I 获得了 A16Z 领投的一轮融资,那时候很多媒体的标题是 "0 收入,10 亿美元估值"。 在之后相当长的时间里,AI 的三大 2C 产品就是 ChatGPT 形态、Perplexity 类搜索以及 C.AI 类陪聊,所以可以看到现在最红海的市场就是大模型类产品、AI 搜索 和 AI 陪聊。 于是,你会发现,2022 年 12 月 5 日,在 Character.AI(以 ...
C.AI 被收购的宿命论与万恶的 Scaling Law | 42章经
42章经· 2024-08-18 13:52
聊 C.AI 不能只聊 C.AI,更不能只聊陪聊类产品,因为这些都是表象。如果从背后更深一层的商业逻辑来看,我们就会发现 C.AI 被收购几乎是一种必然,这就是 典型的个体在整个商业世界运作规则之下的命运轨迹的缩影。 最近很多人在谈论 C.AI 被收购的问题时都有很多迷思,我们先来陈述几个事实: 1)这笔交易是一种以授权协议变相进行的收购,主要目的是为了绕过反垄断的监管 2)C.AI 始终标榜自己是家底层模型研发公司,而非应用公司 Character.ai 是一家全栈通用人工智能 ( AGI ) 公司。 其实 C.AI 的结局几乎从这个时候就已经注定了,就是当 "全栈" 这个词出现的时候。 3 )最终交易完成后近 30 人的底层模型开发人员加入 Google,剩下 100 余人跟产品相关的团队剥离出来留在 C.AI 所以,C.AI 被收购其实和他产品做的如何或者陪聊类产品形态成立与否等都不相关,而要真正读懂 C.AI 的故事,还是要从他的创始人入手,因为公司的结局取决 于其每一步的选择,而这些选择都是创始人经历和性格的缩影。 C.AI 创始人 Noam Shazeer 是 transformer 论文的八个作 ...