Workflow
语言模型
icon
Search documents
一文读懂美国AI之战--“科技五巨头”与“AI三小龙”的战争
硬AI· 2025-06-24 12:28
Meta展开疯狂人才争夺战,凸显美国AI军备竞赛的竞争激烈程度。传统科技巨头各有优劣:苹果硬件优势仍存但AI落 后;谷歌基础设施领先但搜索业务受威胁;微软与OpenAI关系紧张;亚马逊后发制人潜力巨大。AI新贵中,OpenAI主导 消费市场,Anthropic专攻开发者,xAI处境最艰难,战略分化明显。 硬·AI 作者 | 董 静 苹果、谷歌、Meta、微软和亚马 逊这五大科技巨头面临着来自 OpenAI、Anthropic和xAI 等"AI三小龙"的 挑战,各家公司都在争夺这个可能重新定义整个科技产业的新时代的主导权。 Meta首席执行官扎克伯格近期的疯狂招聘行动揭示了这场竞争的激烈程度 。据 华尔街见闻此前文章提及 ,Meta首席执行官扎克伯格正展开疯狂的人才争夺战,亲自联系数百名研究人员加入其新成立的"超级智 能"实验室,给单个人才开出的薪酬甚至达到1亿美元,凸显该公司在AI竞赛中的焦虑。 传统科技巨头与AI新贵之间的博弈不仅关乎技术领先地位,更直接影响着各自的核心商业模式。对于谷歌而 言,ChatGPT等对话式AI对其搜索业务构成颠覆性威胁;而对苹果来说,AI更多是增强其设备体验的补充工 具。这种差异 ...
夏季达沃斯论坛解读发展中国家发展之道
Zhong Guo Xin Wen Wang· 2025-06-24 12:08
编辑:张澍楠 广告等商务合作,请点击这里 就发展中国家如何找到适合自身的发展道路相关问题,与会专家给出了自己的看法。约翰斯·霍普金斯 大学艾尔弗雷德·钱德勒政治经济学讲席教授洪源远(Yuen Yuen Ang)认为,对发展中国家来说,工业化 是当务之急,没有任何国家能在不进行工业化的情况下变得富裕。她同时指出,许多发展中国家当前面 临的最大问题是,有了药方,却难以付诸实践,特别是对越南等国来说,当下全球化大门半开半闭,这 让他们无法完全效仿中国的发展路径,必须转而采用未经实践检验过的方法。 香港交易所主席唐家成则称,工业化的未来集中在创新技术上,中国在该领域进行了大量投资。他举例 说,美国在大语言模型领域投入了大量资金,这让外界一度认为,大量的资金投入是研究大语言模型的 前提。不过,中国大语言模型DeepSeek的出现证明,并不需要数百万美元就可以有针对性地研究构建 大语言模型,这对中小型国家来说是一个绝佳的机会。 安哥拉联合电信公司(Unitel)主席阿吉纳尔多·哈伊梅(Aguinaldo Jaime)以本国为例说,技术来源多元化是 未来所在,还要把学生和工人送到其他国家学习,这样才能更好地运用外来技术。同 ...
大佬面对面!斯坦福2025 CS336课程全公开:从零开始搓大模型~
自动驾驶之心· 2025-06-24 11:47
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 从事大模型方向的小伙伴有福利了!斯坦福大学 2025 年春季的 CS336 课程「从头开始创造语言模型(Language Models from Scratch)」相关课程和材料现已在网上全面发布! 该课程教职工团队,阵容十分豪华~ 课程视频:https://www.youtube.com/watch? v=SQ3fZ1sAqXI&list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_ 课程主页:https://stanford-cs336.github.io/spring2025/ 讲师Tatsunori Hashimoto:现为斯坦福大学计算机科学系助理教授。其为斯坦福大学 John C. Duchi 和 Percy Liang 的博士后,研究机器学习模型平均性能和最差性能之间的权衡。此前在麻省理工学院攻读研究生,导师是 Tommi Jaakkola 和 David Gifford。本科就读于哈佛大学学习统计学和数学,导师是 Edoardo Airoldi。并且该讲 师的研究成果已 ...
赞同科技携金融科技成果亮相2025中国国际金融展
Sou Hu Cai Jing· 2025-06-24 09:20
备受瞩目的2025中国国际金融展在上海世博展览馆成功举办,本届展会以"开放创新,科技赋能,共创金融新未来"为主题,汇聚了400余家国内外金融机 构、科技企业及行业组织。 除了引人注目的轻终端设备,赞同科技还在展会上展示了基于纯血鸿蒙系统HarmonyOS 5.0的手机银行产品。该产品深度融合了鸿蒙系统的原生能力,如鸿 蒙原子服务等,为用户带来了个性化且直观的服务体验。同样,该产品也依托大语言模型驱动业务办理流程,用户只需用一句话表达自己的需求,AI即可 智能地完成一系列业务办理,高效达成用户的最终目的。该手机银行产品的推出,不仅提升了用户的服务体验,更展现了赞同科技在金融数字化方面的深厚 积累和创新能力。 赞同科技受邀参展并在展会上惊艳亮相,成为展会的一大亮点。在此次金融展中,赞同科技携手业界巨头华为和中兴,联合推出了基于先进大语言模型驱动 业务流程模式的多用途业务轻终端方案。这一创新设备具备极高的灵活性,能够在平板模式和终端模式之间自如切换,全面覆盖了网点从移动业务到柜面业 务的全量业务范围,彻底颠覆了传统网点的服务模式,使网点服务及网点建设全面迈入"肩并肩"式移动新形态。 本届金融展会上,赞同科技的创新成 ...
突发!字节Seed大语言模型负责人被开除损失数千万
是说芯语· 2025-06-24 02:05
Core Insights - ByteDance recently disclosed a serious violation involving senior members of the Seed team, resulting in the dismissal of the head of the Seed large language model, Qiao Mu [1] - The violation involved an inappropriate personal relationship between Qiao Mu and an HRBP, which breached the company's conflict of interest policy [1] - Qiao Mu's total earnings at ByteDance over 11 years are estimated to exceed 500 million RMB, with significant income from stock options [2] Group 1 - The violation included failure to declare a personal relationship that violated company policy regarding conflicts of interest [1] - Qiao Mu and the HRBP provided false statements during the investigation, leading to severe disciplinary actions including termination and forfeiture of year-end bonuses [1] - Qiao Mu's estimated annual salary is over 10 million RMB, based on industry comparisons [1][2] Group 2 - The company's stock options have significantly appreciated, with the repurchase price rising from approximately 5 USD per share in 2014 to 189 USD, a 38-fold increase [2] - If Qiao Mu's compensation included 1 million RMB in cash and 1 million RMB in options, the value of the options would have surged to about 39 million RMB today [2] - The Seed team has recently released the Seed1.5-VL model, which demonstrates advanced multimodal understanding and reasoning capabilities [3]
字节“开除” Seed 大模型负责人,因亲密关系踩红线
程序员的那些事· 2025-06-24 00:46
Seed 某前员工(即乔木)与支持其团队的某前 HRBP 存在亲密关系,属于利益冲突的禁止场景(如存 在上下级关系、拥有共同直属上级、一方是另一方的 HRBP 等情形)。二人均未进行利益冲突申报并在 接受调查过程中多次作虚假陈述,公司已将二人辞退,并扣罚全部年终奖。 Seed 是字节跳动豆包大模型团队名称,乔木作为负责人在字节跳动内部拥有较高职级,曾是直接向字节跳动 CEO 梁汝波汇报的核心团队成员之一。 早在今年 3 月 27 日,网上传出乔木的妻子罗某在网上实名举报丈夫婚内出轨同部门 HRBP 程某,晒出亲密 消费记录、聊天录音及财产隐瞒证据,进而引发全网热议。详情请看这篇旧文:《 婚内出轨 | 字节技术大佬 乔某,他身价大概是多少? 》。 2025 年 6 月 23 日,字节跳动发布新一期廉政通报,Seed 大语言模型负责人乔木被公司辞退。 - EOF - 推荐阅读 点击标题可跳转 1、 中国工程师携硬盘海外训练 AI,这波神操作引全球关注,外交部正式回应 2、 10 句话让 Cursor 的编程水平提... 3、 41 岁程序员连续 4 年住车里,被质疑占用公共资源。网友一边倒 据网友称,辞退乔木这事 ...
无损减少80%激活值内存,提升5倍训练序列长度,仅需两行代码
机器之心· 2025-06-23 07:44
本文的第一作者罗琪竣、第二作者李梦琦为香港中文大学(深圳)计算机科学博士生,本文在上海交通大学赵磊老师、香港中文大学(深圳)李肖老师的指 导下完成。 长序列训练对于模型的长序列推理等能力至关重要。随着序列长度增加,训练所需储存的激活值快速增加,占据训练的大部分内存。即便使用梯度检查点 (gradient checkpointing)方法,激活值依然占据大量内存,限制训练所能使用的序列长度。 来自港中文(深圳)和上海交通大学的团队提出 StreamBP 算法。通过对链式法则进行线性分解和分步计算,StreamBP 将大语言模型训练所需的激活值 内存(logits 和 layer activation)降低至梯度检查点(gradient checkpointing)的 20% 左右。 论文标题:StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs 在相同内存限制下,StreamBP 最大序列长度为梯度检查点的 2.8-5.5 倍。在相同序列长度下,StreamBP 的速度和梯度检查点接近甚至更快。 S ...
2025年AI在多个方面持续取得显著进展和突破
Sou Hu Cai Jing· 2025-06-23 07:19
多模态 AI 能够处理和整合多种形式的输入,如文本、图像、音频和视频等,成为 2025 年 AI 领域的关键趋势。像 OpenAI 的 GPT-4 能从文本、音频和视觉 输入生成文本,谷歌的 Gemini 模型展示出出色的多模态能力,微软的 Designer 应用利用多模态 AI 进行图形设计任务。其应用广泛,在医疗保健领域可结 合医疗图像和患者病史进行更准确的诊断,在客户服务方面能提供更直观和全面的支持,在内容创作上能根据单一提示生成多种媒体类型。 2025 年 AI 在多个方面持续取得显著进展和突破,主要的发展趋势和特点: Ai生成 AI 智能体正变得日益复杂,从简单的聊天机器人向更智能、具有情境感知能力的助手转变。它们在各个平台上改变着客户服务、生产力和用户交互方式。 例如,智谱 AI 开放日推出的智能体可替用户点外卖,能在无人工干预下完成跨应用程序、多步骤的真实任务。2025 年,智能体将更加普及,能处理更复杂 的任务,为供应链经理、软件开发人员、金融分析师等提供支持,并有望革新自动驾驶领域。 #AI这一年 2025 年见证了小语言模型(SLMs)的快速发展和广泛采用。这些更紧凑的模型相比大型语言模型 ...
新鲜出炉!斯坦福2025 CS336课程全公开:从零开始搓大模型
机器之心· 2025-06-23 04:04
机器之心报道 编辑:Panda 斯坦福大学 2025 年春季的 CS336 课程「 从头开始创造语言模型(Language Models from Scratch) 」相关课程和材料现已在网上全面发布! 这是该课程的教职工阵容: 其中,讲师 Tatsunori Hashimoto 现为斯坦福大学计算机科学系助理教授。此前,他是斯坦福大学 John C. Duchi 和 Percy Liang 的博士后,研究机器学习模型平均性 能和最差性能之间的权衡。在博士后研究之前,他在麻省理工学院攻读研究生,导师是 Tommi Jaakkola 和 David Gifford。他本科在哈佛大学学习统计学和数学, 导师是 Edoardo Airoldi。他的研究成果已总计获得了超 3 万引用。 | Other names » | | | | | | | --- | --- | --- | --- | --- | --- | | Assistant Professor, Stanford | | | | | | | Verified email at stanford.edu - Homepage | | | | Cited ...
FindingDory:具身智能体记忆评估的基准测试
具身智能之心· 2025-06-22 10:56
点击下方 卡片 ,关注" 具身智能 之心 "公众号 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 一、研究背景与核心问题 长期记忆缺失 是当前具身智能体的关键瓶颈。尽管视觉语言模型(VLMs)在规划与控制任务中表现突 出,但其 处理跨时空的多模态观察数据 能力严重受限: 核心矛盾 :具身智能需整合长期历史经验(如"找到昨天未整理的玩偶"),但缺乏针对性评估框架。 二、基准设计创新点 2.1 任务架构 作者丨 Karmesh Yadav等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 动态环境交互 记忆推理验证 输入限制 :主流VLMs仅能处理数百张图像(远低于真实场景的千帧级输入) 评估缺陷 :现有视频QA基准(如EgoSchema)依赖选择题形式,无法评估 物体操纵/导航 等需细粒 度推理的具身任务 记忆-动作脱节 :传统方法孤立评估记忆召回与决策执行,忽视二者在具身环境中的耦合性 动态环境构建 :脚本代理在Habitat模拟器中执行物体抓取-放置(Pick-and-Place),产生 ...