机器之心

Search documents
MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
机器之心· 2025-06-06 09:36
机器之心发布 机器之心编辑部 在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。 华为团队重磅推出昇腾平台原生设计的 Pangu Pro MoE 72B模型,大幅降低计算开销, 并在SuperCLUE千亿内模型并列国内第一 。 通过系统级软硬协同优化、高性能算子融合优化、模型原生投机算法优化, Pangu Pro MoE 推 理性能提升 6~8 倍,在昇腾 300I Duo 上单卡吞吐可达 321 tokens/s,实现极致性价比;在昇腾 800I A2 上更可飙升至 1528 tokens/s ,全面释放硬件潜力,打造极致的推理体验。 技术报告地址: https://gitcode.com/ascend-tribe/ascend-inference- system/blob/main/%E6%98%87%E8%85%BE%E5%B9%B3%E5%8F%B0Pangu%20Pro%20MoE%E5%85%A8%E9%93%BE%E8%B7%AF%E9%AB%98%E6%80%A7%E8% 推理效率拉满:全链路推理系统优化,释放昇腾澎湃算力 在大模型 ...
不愁了!开源智能体Paper2Poster「一键生成」学术海报
机器之心· 2025-06-06 09:12
做海报有多痛苦? 大家做学术应该都懂那种感觉:临近 DDL 前熬夜赶制海报,得把上万字的论文浓缩进一页 PPT,还要图文并茂兼顾美观。一不小心排版崩了、字体太小或 者信息太多,导师改起来也是花样百出,直呼「再精简!」……可以说,做学术海报是科研工作中让人头秃的环节之一。 要是有个工具能替我们自动把论文变成海报就好了? 还别说,真的有科研团队朝这个方向努力了!2025 年 5 月,来自滑铁卢大学、新加坡国立大学和牛津大学的研究者发布了一个有趣的系统—— Paper2Poster。顾名思义,它试图用大型语言模型(LLM)当助手,把长篇论文内容自动生成一张精美的学术海报。 论文标题: Paper2Poster: Towards Multimodal Poster Automation from Scientific Papers 这个工作开创了学术海报自动生成的新领域:一方面,它提出了首个从论文生成海报的完整框架,能够智能提炼论文并排版;另一方面,作者还搭建了配套 的评测基准和指标体系,来量化评估 AI 生成海报的效果。换句话说,不仅要让 AI 会「画」海报,还要知道它画得好不好,这可是前所未有的尝试。 插图 1: ...
10行代码,AIME24/25提高15%!揭秘大模型强化学习熵机制
机器之心· 2025-06-05 07:14
本文作者分别来自于清华大学、北京大学、上海AI实验室等机构。本文共同第一作者崔淦渠、张宇臣、陈嘉诚来自上海AI实验室,研究方向为大模型的推理增 强。通讯作者为上海AI实验室成宇教授、上海AI实验室周伯文教授、清华大学丁宁助理教授。 Nature never undertakes any change unless her interests are served by an increase in entropy. 自然界的任何变化,唯有在熵增符合其利益时方会发生—— Max Planck 在强化学习中,我们又该如何让熵增符合我们的利益? 近日,来自上海人工智能实验室、清北,UIUC 等机构的研究者的工作揭示了大模型强化学习中的熵变化的机制。研究内容主要如下: 在 Qwen, Mistral, LLaMA 和 Deepseek Model family 上,我们验证了这一点: 论文标题:The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models 1. 大模型强化学习中的熵塌缩问题 强化学习的核心挑战在于利用 - 探 ...
刚刚,新一届ACM博士论文奖正式公布
机器之心· 2025-06-05 07:14
机器之心报道 编辑:张倩、+0 近日,新一届 ACM 博士论文奖正式公布。 该奖项每年颁发给计算机科学与工程领域最佳博士论文的作者。今年颁发的是 2024 年的奖项,包括一个博士论文奖和两个博士论文奖荣誉提名。 获得博士论文奖的论文非常有现实意义,它研究的是:现在心理健康问题越来越多,但专业心理医生不够用,怎么办? 我们知道,在 DeepSeek 等 AI 模型火起来之后,很多人都把 AI 当成了心理医生。但很多时候,AI 并不能像真正的心理治疗师一样提供专业指导。或许,「人机 协作」是条更现实的折中路线。 在论文中,获奖作者 Ashish Sharma 探索了多种方法来实现更好的人机协作。他的方法类似于: 他最近开发的 AI 辅助心理健康工具已被公开发布,并有超过 16 万用户使用,其中大多数是低收入人群。使用这些工具的人群中,超过 50% 的家庭年收入低于 4 万美元。 除了这篇论文,还有两篇论文获得了博士论文奖荣誉提名,其中一篇研究的问题是「利用伪随机分布揭示低复杂度计算模型的固有计算局限性」;另一篇则专注 于「大型语言模型如何利用它们在训练时学习到的海量文本数据」。 随着全球心理健康问题激增,医疗保健 ...
重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结
机器之心· 2025-06-05 04:40
以下文章来源于智源社区 ,作者智源社区 智源社区 . 继承学术出版严谨与系统,兼具新闻报道及时与多元;为内行搭建思想交流媒介,以事实启迪公众对AI认知 2025年 6月6日-7日, 第7届北京智源大会 将以线上+线下联动的形式召开, 4位图灵奖获 得者演讲,30余位AI企业创始人&CEO分享,100余位全球青年科学家报告,两天会议将 密集开展180余场人工智能主题演讲,在思辨与实证的交织中,为 AI 的未来绘制航图。报 名通道已开启 。 北京智源大会倒计时: 1 天 2 0 2 5 北 京 智 源 大 会 完 整 日 程 线下参会地址: 北京中关村国家自主创新示范区展示中心 线上直播链接: https://2025.baai.ac.cn/ 2025智源大会日程: https://2025.baai.ac.cn/schedule 本 届 大 会共计 20场专题论坛 ,180余场精彩报告研讨 6 月 6 日 开幕式及全体大会,大模型产业CEO论坛,NeuroAI:神经智能,自主智能体,AI+理工&医学,AI系统和开源,AI for Industry,类脑大模型, InnoVibe共创场特色活动 6 月 7 日 具 ...
ICML 2025|趣丸研发新型人脸动画技术,声音+指令精准控制表情
机器之心· 2025-06-05 04:40
本研究由广州趣丸科技团队完成,团队长期致力于 AI 驱动的虚拟人生成与交互技术,相关成果已应用于游戏、影视及社交场景。 趣丸科技团队提出了一种新颖的肖像驱动框架 Playmate ,该算法能够根据音频和各种可选的控制条件生成高质量的肖像视频。通俗来讲,就是给定一张照 片和一段音频,就可以生成对应的视频,同时还能精准控制人物的表情和头部姿态。相关研究成果已被人工智能顶会 ICML 2025 收录,项目代码开源计划 正在筹备中。 Playmate 是一种由广州趣丸科技团队提出的基于 3D 隐式空间引导扩散模型的双阶段训练框架,旨在生成高质量且可控的肖像动画视频。该方法通过解耦 面部属性(如表情、唇部动作和头部姿态),结合情绪控制模块,实现了对生成视频的精细控制。实验表明,Playmate 在视频质量、唇同步准确性和情绪 控制灵活性方面均优于现有方法,是音频驱动肖像动画领域的重大进展。 论文标题:Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion 论文地址:https://arxiv.org/ ...
真实联网搜索Agent,7B媲美满血R1,华为盘古DeepDiver给出开域信息获取新解法
机器之心· 2025-06-05 04:40
机器之心发布 大型语言模型 (LLM) 的发展日新月异,但实时 「 内化 」 与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部 知识的策略? 机器之心编辑部 华为诺亚方舟实验室研究团队提出了 Pangu DeepDiver 模型,通过 Search Intensity Scaling 实现了 LLM 搜索引擎自主交互的全新范式,使得 Pangu 7B 模型在开域 信息获取能力上可以接近百倍参数的 DeepSeek-R1,并优于 DeepResearcher、R1-Searcher 等业界同期工作! 论文链接 :https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-deepdiver-report.pdf arxiv 链接: https://arxiv.org/abs/2505.24332 该项研究的主要发现如下:(1)对于复杂信息获取任务,端到端 Agentic RL 训练相比直接蒸馏老师轨迹能更好地实现 Search Intensity Scaling,从而带来平均 10 PCT 效果提升;(2)基于真实 ...
OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
机器之心· 2025-06-05 02:00
机器之心报道 编辑:Panda OpenAI 发论文的频率是越来越低了。 如果你看到了一份来自 OpenAI 的新 PDF 文件,那多半也是新模型的系统卡或相关增补文件或基准测试,很少有新的研究论文。 至于原因嘛,让该公司自家的 ChatGPT 来说吧:「截至目前,OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少,可能反映了其对研究成果公开策略的 谨慎态度,可能出于商业保密或安全考虑。」 不过近日,OpenAI 也确实发布了一份完全由自己人参与的、实打实的研究论文,其中提出了一种用于高效张量映射的统一代数框架 Linear Layouts 。这是一种使 用二元线性代数而非比特表示(bit representation)的张量布局的通用代数形式,解决了 Triton 等深度学习编译器中长期存在的难题。 论文标题:Linear Layouts: Robust Code Generation of Efficient Tensor Computation Using ₂ 对于现代深度学习工作负载而言,所需要的张量布局需要满足几个要求: 然而,当前的布局系统却难以充分满足这些需求,而是往往: ...
ACL 2025 | 基于Token预算感知的大模型高效推理技术
机器之心· 2025-06-05 02:00
本位作者分别来自南京大学,罗格斯大学和马萨诸塞大学阿默斯特分校。第一作者韩廷旭与共同第一作者王震霆是分别来自南京大学和罗格斯大学的博士生,研 究方向聚焦于大模型推理以及安全负责任的生成式人工智能。通讯作者为南京大学房春荣教授。 随着大型语言模型(LLM)技术的不断发展, Chain-of-Thought(CoT) 等推理增强方法被提出,以期提升模型在数学题解、逻辑问答等复杂任务中的 表现,并通过引导模型逐步思考,有效提高了模型准确率。 然而,这类方法也带来了新的挑战:模型生成的中间推理过程往往冗长,产生了大量冗余 Token ,这显著增加了推理阶段的计算成本和资源消耗。在 LLM 日益走向实际部署的背景下,如何在保证推理能力的同时控制成本,已成为制约其大规模应用的核心问题。 为解决这一矛盾,近日来自南京大学、罗格斯大学和马萨诸塞大学阿默斯特分校的研究团队提出了一种基于 Token 预算感知 的 LLM 推理新框架 TALE , 旨在保证推理准确率的同时,显著压缩输出长度、降低计算开销。 TALE 的核心理念是在推理过程中引入「Token 预算」这一约束机制,引导模型在限定的 Token 预算范围内完成有效推理 ...