Workflow
推理
icon
Search documents
大家都在用AI,程度远超你想象
3 6 Ke· 2025-06-30 07:18
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:当公众的目光都聚焦在AI模型迭代时,一场真正的革命已悄然发生:全球企业级AI推理用量正呈指数级飙升,其商业变现能力远超预期。本文用 硬核数据揭示这场静默爆发的产业质变。文章来自编译。 很长时间以来,大多数AI服务(尤其是推理API)的使用量与收入的增长都极其迅猛。SemiAnalysis的Dylan Patel指出,这些API对企业来说利润非常高—— 毛利率有时候高达75%甚至更高。这在搞AI的人当中是众所周知的一个公开事实,但在新模型发布与功能炒作此起彼伏的喧嚣当中,广大公众反而可能忽视 了这一点。 我认为向普通用户提供订阅服务也是盈利的,但重度用户很可能会成为AI公司的成本负担,再加上训练尖端模型还需要明显的资本支出。尽管如此,即便 模型保持不变,其使用量也在呈指数级增长,而且其中很大一部分都在盈利范围内。 早在今年上半年我们看到整个行业取得诸多惊人进展之前,AI使用的极端(某些情况下是指数级)增长就已经发生了。推理模型将推理答案从几百个token 扩展到有时数万个token,这会让使用量图走势限 ...
算力硬件股反复活跃 景旺电子3天2板创历史新高
news flash· 2025-06-30 05:16
算力硬件股反复活跃 景旺电子3天2板创历史新高 智通财经6月30日电,算力硬件股反复活跃,PCB方向领涨,景旺电子走出3天2板,创历史新高,此前 澳弘电子涨停,源杰科技、中际旭创、生益电子、新易盛等涨幅靠前。消息面上,中信建投研报称,英 伟达召开股东大会瞄准AI基础设施平台商定位,海内外头部厂商持续发力基础设施建设以满足激增的 推理算力需求,ASIC市场空间预期持续上调,算力产业链保持高景气。 ...
新国立×上交发布RoboCerebra:长时序机器人操作推理的全新评测基准
自动驾驶之心· 2025-06-29 11:33
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 SonghaoHan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 Ideal Dynamic Memory Execution Memory Exploration Mix 1 问题背景与动机 近年来,视觉-语言模型(VLM)凭借对图像与文本的强大对齐能力,为机器人带来了"看图执行指令"的全 新范式。研究者只需给出一句自然语言命令,机械臂便能在仿真或真实桌面环境中完成抓取、移动、放置 等操作。这类系统通常以 VLA 等 "小脑" 模型的形式存在:直接把多模态观测映射到低层控制信号,强调 即时反应与传感-运动耦合。然而,随着任务场景从单步抓取扩展到家庭级复合操作,仅靠小脑反应已难以 胜任;机器人还需要 "大脑" VLM 进行长期规划、记忆管理与自我反思,并与小脑 Controller 高效协同。 现有公开基准的平均任务长度不足 500 步,也很少显式考察大小脑协作(Planner ...
首次大规模使用“非英伟达”芯片,OpenAI租用谷歌TPU,降低推理计算成本
华尔街见闻· 2025-06-29 06:11
Group 1 - OpenAI has begun renting Google's TPU chips for the first time on a large scale, reducing its reliance on NVIDIA's GPUs and alleviating pressure on Microsoft's data centers [1][2] - OpenAI's demand for computing power has surged, with paid subscribers for ChatGPT increasing from 15 million at the beginning of the year to over 25 million, alongside hundreds of millions of free users [1] - Companies like Amazon, Microsoft, OpenAI, and Meta are developing their own inference chips to decrease dependence on NVIDIA and lower long-term costs [1][2] Group 2 - OpenAI spent over $4 billion on NVIDIA server chips last year, with training and inference costs each accounting for half, and is projected to spend nearly $14 billion on AI chip servers by 2025 [2] - The shift to Google's TPU was driven by the explosive popularity of ChatGPT's image generation tool, which increased pressure on OpenAI's inference servers [2] - Google has been developing TPU chips for about a decade and has provided this service to cloud customers since 2017, with other companies like Apple and Cohere also renting Google's TPU [2][4] Group 3 - Meta is also considering using TPU chips, indicating a broader trend among major AI chip customers [3] - Google Cloud continues to rent out NVIDIA-supported servers, as they remain the industry standard, generating more revenue than renting TPUs [4] - Google has ordered over $10 billion worth of the latest Blackwell server chips from NVIDIA, starting to provide them to select customers since February [4]
速递|Meta两周挖走至少7名OpenAI成员,其中4名华人,否认1亿美元签约金,CTO揭开高管薪酬复合结构
Z Potentials· 2025-06-29 05:20
图片来源: Unsplash 最新从 OpenAI 加入 Meta 的赵博士是 OpenAI 多款模型的核心贡献者,包括 o1-mini 和 o3-mini 模 型。后者作为该公司的小型快速推理模型,其性能表现令开发者印象深刻。去年秋季, o1-mini 在数 学能力上甚至超越了 OpenAI 更大的 o1-preview 模型。 根据领英资料显示,赵博士在 2022 年 6 月加入 OpenAI 前,曾是斯坦福大学计算机科学专业的博士 候选人。 根据余嘉辉的领英个人资料显示,他曾领导 OpenAI 的一个感知技术团队,专注于研究人工智能如何 收集和理解周围环境信息。毕书超在领英资料中显示为 OpenAI 多模态后训练负责人。任宏宇同样是 o1-mini 和 o3-mini 项目的核心贡献者。根据赵的公开研究资料显示,他曾在 2018 年与任合作发表过 一篇关于生成式 AI 模型偏见的论文。 过去一周, Meta 从 OpenAI 苏黎世办公室挖走了三名研究人员。这三人专注于多模态 AI 研究,即能 够识别和生成文本、视频及音频的模型。他们于去年底从 Google DeepMind 加入 OpenAI 。研究 ...
豆包1.6 “不偏科” ,高考成绩直逼“清北”
文科成绩683分,理科648分。 近日,豆包Seed1.6-Thinking模型测试了2025高考全科,交出一份成绩优异的答卷。该测试采用全国新 一卷和山东省自主命题。 豆包多项考试成绩优异,高考成绩直逼"清北" 随着高考的结束,AI大模型也开启了一轮"竞技"。 豆包不"偏科",推理效果和性能更加平衡 细心的网友可能看到,豆包理科成绩怎么比文科差几十分?AI大模型是不是偏科呀? Seed团队表示,首次测试时使用的网络版考卷清晰度较低,各大模型在化学、生物两门非常依赖图像的 考试中丢分较多。该团队在获得更高清版本的高考试题图片后,采用图文交织的方式对化学和生物重新 进行测试,发现豆包模型在这两科上能够提升近30分,理科总成绩可达到676分,验证了全模态推理可 以更大程度激发模型的潜力。 这不但证明了豆包Seed1.6-Thinking模型并不偏科,同时也具备了较好的视觉推理能力。也说明结合文 本和图片进行全模态推理可以更大程度激发模型的潜力,相信这也是未来值得投入的研究方向。 2025年高考测试结果显示,豆包的语文、英语、物理、历史、地理、政治六门学科获最高分,数学成绩 也超过140分;DeepSeek R1获 ...
北航×新国立×上交发布RoboCerebra:长时序机器人操作推理的全新评测基准
具身智能之心· 2025-06-28 07:48
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 SonghaoHan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 Ideal Dynamic Memory Execution Memory Exploration Mix 1 问题背景与动机 近年来,视觉-语言模型(VLM)凭借对图像与文本的强大对齐能力,为机器人带来了"看图执行指令"的全 新范式。研究者只需给出一句自然语言命令,机械臂便能在仿真或真实桌面环境中完成抓取、移动、放置 等操作。这类系统通常以 VLA 等 "小脑" 模型的形式存在:直接把多模态观测映射到低层控制信号,强调 即时反应与传感-运动耦合。然而,随着任务场景从单步抓取扩展到家庭级复合操作,仅靠小脑反应已难以 胜任;机器人还需要 "大脑" VLM 进行长期规划、记忆管理与自我反思,并与小脑 Controller 高效协同。 现有公开基准的平均任务长度不足 500 步,也很少显式考察大小脑协作(Planner ...
DeepSeek-R2为什么还没发?
猿大侠· 2025-06-27 14:57
Core Viewpoint - The release of DeepSeek-R2 has been delayed due to CEO Liang Wenfeng's dissatisfaction with its performance and a shortage of Nvidia H20 chips, which are critical for its development [1][2][4]. Group 1: Development Timeline - The anticipation for R2 began after the release of the DeepSeek-V3 model in December last year, which was considered a benchmark for cost-performance [5]. - Initial expectations suggested that R2 would be launched in April, following the upgrade of V3 on March 24 [11]. - Despite the release of a paper on inference scaling in April, there has been no official update on R2's launch [12][16]. Group 2: Technical Specifications - R1's training utilized 30,000 H20 chips, 10,000 H800 chips, and 10,000 H100 chips, indicating the significant computational resources required for R2 [3]. - Leaked parameters for R2 suggested it would have 1.2 trillion parameters and utilize 5.2 petabytes of training data, raising questions about its hardware requirements [17]. Group 3: Community Reactions - Following the news of the delay, community responses varied, with some expressing belief that the delay would be worthwhile, while others speculated that R2 might wait for the release of V4 [26][28].
腾讯混元首个开源混合推理MoE模型在魔搭社区首发
news flash· 2025-06-27 09:56
6月27日,腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B在魔搭社区首发。该模型总参数80B, 激活参数仅13B,是业界首个13B级别的MoE开源混合推理模型,效果比肩同等架构领先开源模型。开 发者可以用更低门槛的方式获得领先的模型能力。(全天候科技) ...
Meta挖角OpenAI核心研究员 强化AI推理模型布局
news flash· 2025-06-26 16:31
Meta挖角OpenAI核心研究员 强化AI推理模型布局 金十数据6月27日讯,据科技媒体TechCrunch报道,知情人士表示,Meta已聘请极具影响力的OpenAI研 究员Trapit Bansal,加入公司新成立的AI超级智能部门,从事AI推理模型相关工作。Bansal的加入可能 为Meta的AI超级智能实验室带来重要助力。该实验室目前已汇聚多位行业领军人物,包括前ScaleAI首 席执行官Alexandr Wang、前GitHub首席执行官Nat Friedman以及Safe Superintelligence联合创始人Daniel Gross。值得注意的是,Meta目前尚未在其开源模型家族Llama系列中,公开推出任何AI推理模型。近几 个月来,扎克伯格正通过高薪密集招募人才,以组建Meta全新的AI团队,据传为顶级研究员提供的薪 酬方案高达1亿美元。不过,Bansal此次加盟的具体薪资待遇尚未对外披露。 订阅人工智能动态 +订阅 ...