大语言模型
Search documents
两个LLM互相对线,推理能力起飞:康奈尔团队发布大模型版类GAN训练法
机器之心· 2025-12-07 02:52
大型语言模型(LLMs)虽然通过可验证奖励的强化学习(RLVR)取得了显著进展,但仍然在很大程度上依赖外部监督(例如人工标注的数据)。自博弈(self- play)提供了一种有前景的替代方案,使模型能够通过与自身反复对抗来学习,从而减少对外部监督的依赖。GAN 则提供了另一种更具吸引力的训练范式:通过 对抗式地训练两个模型,其中一个模型专注于生成具有挑战性的任务或对抗样本,另一个模型则专注于解决这些任务。 于是问题来了:LLM 是否也可以像 GAN 一样进行训练?我们的希望是,通过赋予每个模型不同的专门化角色,可以促进持续的竞争与共同进化,从而让它们能 够解决单一模型可能从根本上无法胜任的任务。 为解决这一难题,来自康奈尔大学的 NLP 团队提出了 Pa soDo ble ,一个面向大语言模型的全新类 GAN 训练框架。PasoDoble 通过对抗式地训练 两个几乎相同的 模型 :Proposer 用于生成带有标准答案的高难度问题,Solver 则尝试解决这些问题。我们进一步利用高质量的数学预训练语料,并引入离线训练范式,以缓解潜在 的训练不稳定性。值得注意的是,PasoDoble 在整个训练过程中 不依赖 ...
以理想汽车为例,探寻自动驾驶的「大脑」进化史 - VLA 架构解析
自动驾驶之心· 2025-12-07 02:05
作者 | 我要吃鸡腿 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1965839552158623077 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 在自动驾驶这个飞速迭代的领域,技术范式的更迭快得令人目不暇接。前年,行业言必称BEV(鸟瞰图视 角);去年,"端到端"(End-to-End)又成了新的技术高地。然而,每一种范式在解决旧问题的同时,似乎都 在催生新的挑战。 传统的"端到端"自动驾驶,即VA(Vision-Action,视觉-行动)模型,就暴露出一个深刻的矛盾:它就像一个 车技高超但沉默寡言的"老司机"。它能凭借海量数据训练出的"直觉",在复杂的路况中做出令人惊叹的丝滑操 作。但当您坐在副驾,心脏漏跳一拍后问它:"刚才为什么突然减速?"——它答不上来。 这就是"黑箱"问题:系统能"做对",但我们不知道它"为何做对"。这种无法解释、无法沟通的特性,带来了巨 大的信任危机。 自动驾驶的三大范式演进。(a) ...
中国第一,阿里146篇论文入选AI顶会NeurIPS 2025
Cai Jing Wang· 2025-12-05 09:02
NeurIPS是人工智能领域影响力最大的顶会之一,该会议诞生了Transformer、AlexNet等里程碑式研究成 果。今年,谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖科技公司和机构共有2万多篇论 文投稿,仅有约25%的论文被接收。统计数据显示,谷歌、微软、Meta和阿里巴巴是论文数量前四的科 技公司。 据悉,目前阿里千问已开源300多款模型,涵盖全模态、全尺寸,全球下载量突破7亿次,衍生模型超过 18万个,位居全球第一。在Gartner发布的GenAI云基础设施、GenAI工程、GenAI模型以及AI知识管理 应用四大维度的新兴市场象限报告中,阿里云均位于新兴领导者象限,是入选全部四项新兴领导者象限 的唯一亚太厂商。 据介绍,此次阿里入选的146篇论文全面覆盖了模型训练框架、数据集和模型基础研究和模型推理优化 等领域,展现了阿里在全栈AI体系的创新成果。 12月5日消息,人工智能领域顶级国际会议NeurIPS 2025在美国圣迭戈召开,本届会议,阿里巴巴共146 篇论文入选,是论文收录数量最多的中国公司。其中,阿里千问在门控注意力机制上的成果被评为最佳 论文,为唯一获奖的中国公司。 在训练 ...
豆包发布语音识别模型2.0 支持多模态视觉识别和13种海外语种识别
Mei Ri Jing Ji Xin Wen· 2025-12-05 08:10
据官方介绍,2.0版本模型推理能力提升,可以通过深度理解上下文完成精准识别,上下文整体关键词 召回率提升20%。支持多模态视觉识别,在听得懂的同时看得懂,可以通过单图和多图等视觉信息输入 提升文字识别精准度。支持日语、韩语、德语、法语等13种海外语种的识别。并且重点针对专有名词、 人名、地名、品牌名称及易混淆多音字等复杂场景进行了升级。 (文章来源:每日经济新闻) 每经北京12月5日电(记者李宇彤)12月5日,火山引擎正式发布豆包语音识别模型2.0(Doubao-Seed- ASR-2.0),依托Seed混合专家大语言模型架构构建。 ...
知行科技宋阳:依托庞大工业基础和众多场景,中国能率先在AI领域取得更多突破
Xin Lang Cai Jing· 2025-12-05 08:07
他指出,大语言模型作为基座模型,无论是用于自动驾驶还是机器人,都存在中间跳跃的问题。以多模 态VLA为例,以机器人为例,我在一个房间做一个动作,到另一个场景很难泛化,需要高成本采集数 据。同样,给世界模型增加维度,如重力,模型所需算力和成本会急剧增加,背后还有电力、散热等问 题,这些都是行业存在的问题。 但他对此表示乐观。他认为,依托庞大工业基础和众多场景,利用这些场景和数据推动人工智能发展, 以产业带动AI的方式,中国能率先在人工智能取得更多突破。 新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目 的,并不意味着赞同其观点或证实其描述。 责任编辑:王翔 专题:2025新汽车合作生态交流会 2025新汽车合作生态交流会于12月5日-6日在苏州举行。知行科技创始人兼CEO宋阳出席兵演讲。 宋阳表示,短期看,中国汽车年产量三千万辆,具身智能机器人去年只有50万辆,是汽车的六十分之 一。长期看,自动驾驶汽车本质是轮式机器人,是机器人分支,长远看数量庞大。这两个行业现阶段和 长期如何融合发展,是长期和短期的问题。 宋阳表示,短期看,中国汽车年产量三千万辆,具身智能机器人去年只 ...
AI不是随机鹦鹉,如何应对“有主见”的AI?
Guan Cha Zhe Wang· 2025-12-05 02:12
2025年,堪称中国大语言模型的元年,这一年DeepSeek横空出世,很快在全球掀起风暴,甚至抢走了 OpenAI的风头。 面对一个文科背景的访问者,特伦斯用通俗的语言讲述了,为什么AI技术在经历了60年的研究后最近 几年才突飞猛进,变得如此强大并广泛应用。他用科学家的激情和热忱,逐一打消了我们对于AI大语 言模型"编造事实"、带有偏见、抢人类工作、甚至未来可能威胁人类的各种担忧。他还讲述了自己在 1980年代和其他科学家一起挑战语言学权威和数学权威,将语言之间的联系用方程写出来,从而奠定了 大语言模型基础的故事,并以此来鼓励年轻人,科学探索要不畏惧权威,"当专家告诉你某件事不可能 时,不要听他们的。" 此外,针对各国纷纷出台的AI监管法案,他一再强调AI大语言模型还处在初级阶段,监管过早过细会 影响科学发展。新技术只有被大规模使用,科学家们才能通过试错,发现解决问题的办法。以下是我们 的对话实录。 观察者网【思想者茶座】连线特伦斯·谢诺夫斯基 【对话/观察者网 高艳平】 OpenAI一夜成名背后,经历了60年的积累 观察者网:今年以来,随着DeepSeek等应用的普及,我们开始更频繁的使用AI工具。因此有关 ...
世界太小,不够世界模型们用了
3 6 Ke· 2025-12-04 09:29
世界模型,已经像这个世界一样混乱了。 OpenAI指着Sora生成的视频说,这就是"世界模拟器";杨立昆(Yann LeCun)指着Sora,说它是像素幻 觉,真正的世界模型应该是"预测未来的抽象大脑";谷歌DeepMind称,Genie3就是一个"可交互的通用世 界模型";而李飞飞说,"空间智能"才是正解。 现实世界是唯一的、客观的,但AI圈里似乎人人都在制造属于自己的"世界模型"。 尽管定义南辕北辙,但这群吵得不可开交的大佬们,在一个基本判断上达成了共识:大语言模型早晚到 头,世界模型才是通往AGI的必经之路。 大语言模型在GPT-3.5之后经历了参数的膨胀,而世界模型在技术路线收敛之前,就先经历了概念的通货 膨胀。 世界模型是个筐,啥都往里装 "世界模型"的混乱,根源在于它是一种目的,指的是让AI具备理解外部世界规律,预测世界变化的能力, 而非具体的技术路径。 最先混乱的就是概念。 关于世界模型的思想,最早可追溯至1943年认知科学家Kenneth Craik提出的"心智模型(Mental Model)",即大脑通过构建外部世界的微缩模型来进行预测,换句话说,我们脑中有一个心智模型,不仅 能处理当前看到 ...
南网能源院 | 业务动态(总第53期)
Xin Lang Cai Jing· 2025-12-03 13:25
Group 1 - The strategic department director Zhang Xuan and postdoctoral researcher He Binghao attended the 13th meeting of the China-Germany Energy Working Group at the Global Energy Transition Forum, reviewing the 2024 work results and 2025 work plan, focusing on carbon capture, utilization, and storage, as well as power system flexibility [1] - Senior researcher Yuan Kanglong presented on "Research on the Enhancement of Southern Power Grid's Backbone Network Planning" at the 2025 National Power Grid Technology Exchange Conference, discussing the construction history and effectiveness of the backbone network [3] - The main network and system departments participated in a survey on "Key Equipment Technology and Engineering Applications of Flexible DC Grids," engaging with institutions like Zhejiang University and Tsinghua University to discuss foundational stability theories and key equipment development [5] Group 2 - Researcher Wang Haijin presented a report on "Key Technologies for Electricity-Carbon Accounting Based on Large Language Models" at the 6th International Forum on New Power Systems, highlighting the potential of advanced AI tools in improving the accuracy and efficiency of carbon accounting [7] - Researcher Li Yan discussed the planning layout and demonstration effectiveness of the new power system demonstration area in the southern region at the 2025 Autumn Academic Annual Meeting of "China Electric Power" [9] - Researcher Wang Haijin elaborated on the methodology of electricity-carbon accounting driven by large language models at the IEEE International Conference on Energy Engineering and Power Systems [12] Group 3 - The Guangzhou Electric Power Design Institute won three awards at the National Excellent Engineering Survey and Design Award, marking its first participation in this authoritative industry evaluation [10] - The main network department participated in the 13th International Conference on Power System Control, Operation, and Management, sharing innovative results and practical experiences in power grid planning [8] - The distribution network department conducted research on the "Electric Hong Internet of Things Operating System," focusing on digital architecture and smart terminal technologies to support the distribution network's planning [12] Group 4 - The 2025 Standard Design and Typical Cost System Document Review Meeting was held in Guangzhou, aiming to provide a scientific and unified technical basis for the planning, construction, and operation management of the Southern Power Grid [13] - The innovation management team from the enterprise management department visited Jiangsu Industrial Technology Research Institute to discuss typical experiences in traditional industry transformation [14] - The Yulin Power Supply Bureau engaged in discussions with the Southern Power Grid Energy Institute on the transformation requirements of new distribution systems [16] Group 5 - The investment department director Wu Hongliang and senior researcher Yang Yin held discussions with the deputy dean of Peking University's School of Urban Planning and Design on topics including the impact of ultra-fast charging technology on grid risks [19] - Researcher Wang Fengyun spoke at the 32nd China International Power Equipment and Technology Exhibition, discussing the role of hydrogen energy in new power systems [18] - Researcher Liu Ziyi participated in a preparatory meeting for the Global Sustainable Transportation Innovation Alliance, discussing green transformation and international carbon tax [21]
腾讯公司副总裁蒋杰:AI让广告每个环节都在提效,腾讯会更多启用AI人才
36氪未来消费· 2025-12-03 12:50
"学界做的方案,不比现在工业界自己在做的事情差。" 作者 | 王毓婵 今年三季度,腾讯广告以21%的收入增速,达到了过去六个季度以来的新高峰,所有主要行业的广告主投放均有所增长。 有此成绩,除了因为广告加载率的提高,还因为 AI 驱动的广告定向所带动的 eCPM 增长。财报中特别提到了"腾讯广告AIM+"智能投放产品矩 阵——它支持广告主自动配置定向、出价及版位,并优化广告创意,从而提升他们的营销投入回报。 腾讯方面表示,通过AIM+,广告主每花掉一万元的广告投放费用,对应在广告平台上所需的操作次数下降了80%,在创意环节上的操作次数减 少了47%。 作为AI"军备竞赛"中的强势选手,腾讯已经为AI豪掷了大量资本支出——2024年,腾讯的总资本支出同比增长了221%,2025年全年,这项支 出还会更高。而目前,AI带来的"回头钱",其中一个体现就在腾讯广告业务上。 AI之烧钱,除了在于需要储备大量算力资源外,还体现在人才竞逐上。脉脉发布的《2025年AI人才流动报告》显示,2025年1-7月,AI新发岗 位量同比增长超10倍,简历投递量也暴涨了11倍。"算法"相关人才持续紧缺,其中"搜索算法"人才紧缺度最高, ...
中山大学最新论文登上Cell头条
生物世界· 2025-12-03 10:00
该研究以: The effectiveness of large language models in medical AI research for physicians: A randomized controlled trial 为题,于 2025 年 11 月 26 日发表于 Cell 子刊 Cell Reports Medicine 上 。 中山大学中山眼科中心 林浩添 教授、 陈文贲 副研究员为论文共同通讯作者, 尚元君 博士、 林远帆 博士和 李睿扬 助理研究员为论文共同第一作者。 这项随机对照试验评估了 大语言模型 (LLM) 在 医学人工智能研究 中对医生的有效性,结果显示,大语 言模型能够帮助医生克服技术障碍,协助医生开展医疗人工智能研究,但也存在着幻觉和依赖性风险。 撰文丨王聪 编辑丨王多鱼 排版丨水成文 近日,来自 中山大学中山眼科中心 的一篇新论文登上了 Cell Press 官网头条。 近年来,促进生物学、化学、物理学、材料科学、计算机科学和工程学等不同科学领域合作的 跨学科研究 ,推动了众多科学领域的突破,并开辟了新的增长途径。例如,在数字医学领域,临床实践、计算机科学 及其他学 ...