Workflow
推理
icon
Search documents
类R1训练不再只看结果对错!港中文推出SophiaVL-R1模型
机器之心· 2025-06-06 09:36
DeepSeek-R1 爆火后,类 R1 的结果奖励训练范式在各领域掀起了推理热潮。基于规则的结果奖励实现简单、判断严格。但是,这真的够了吗? 在推理任务中,如果我们只是用「结果对错」来奖励模型,那模型就很可能学会了「靠捷径答题」。 这种模式下,模型的「正确思考策略」没有完全建立起来,它甚至会因为一次「瞎蒙对」的奖励,而在之后反复强化错误策略,越走越偏。 为了解决这个问题,港中文联合上海人工智能实验室团队发布了多模态推理模型 SophiaVL-R1,它在类 R1 强化学习训练框架上做了一次关键进化:不再 只奖励结果是否正确,而是将「思考过程」也纳入奖励体系。 这一套设计不仅能让模型学会更通用、更靠谱的推理策略,还显著提升了泛化能力——在多个数学和通用多模态基准测试中,SophiaVL-R1-7B 甚至击败 了参数量是其 10 倍的 LLaVA-OneVision-72B 模型。 目前,研究团队已将所有模型、数据和代码开源。 思考过程也要评分,才是好模型 SophiaVL-R1 的关键突破点,就在于它引入了「思考奖励」机制 —— 不再只看答案对不对,而是开始评估模型整个推理过程是否合理、连贯、靠谱。 论文链接: ...
MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
机器之心· 2025-06-06 09:36
机器之心发布 机器之心编辑部 在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。 华为团队重磅推出昇腾平台原生设计的 Pangu Pro MoE 72B模型,大幅降低计算开销, 并在SuperCLUE千亿内模型并列国内第一 。 通过系统级软硬协同优化、高性能算子融合优化、模型原生投机算法优化, Pangu Pro MoE 推 理性能提升 6~8 倍,在昇腾 300I Duo 上单卡吞吐可达 321 tokens/s,实现极致性价比;在昇腾 800I A2 上更可飙升至 1528 tokens/s ,全面释放硬件潜力,打造极致的推理体验。 技术报告地址: https://gitcode.com/ascend-tribe/ascend-inference- system/blob/main/%E6%98%87%E8%85%BE%E5%B9%B3%E5%8F%B0Pangu%20Pro%20MoE%E5%85%A8%E9%93%BE%E8%B7%AF%E9%AB%98%E6%80%A7%E8% 推理效率拉满:全链路推理系统优化,释放昇腾澎湃算力 在大模型 ...
中移齐鲁创新院发布“迅测”工具:助力国产芯片选型效率跃升
Qi Lu Wan Bao· 2025-06-06 08:15
随着大模型推理成本持续下降和国产芯片的飞速发展,政务、金融、医疗等对数据安全高度敏感行业, 正加速推进推理模型的国产化本地部署。面对市场上型号众多、性能差异显著的国产智算芯片,如何高 效、准确地压测模型推理性能,成为筛选出兼具高性能与低成本的芯片的关键挑战。 为攻克这一难题,中移齐鲁创新院自主研发"迅测"芯片推理性能自动压测工具,该工具创新性地构建 了"配置即测试"的压测模式,并集成了强大的数据自动解析能力,旨在破解国产芯片快速选型的瓶 颈。"迅测"工具的应用带来了显著的效率变革,单轮测试所需的人工值守时长从平均8小时大幅降至0.5 小时,数据整理耗时减少70%,整体芯片选型效率平均提升3倍。 采用标准化数据存储机制,自动计算并生成错误率、单路输出速度等核心性能指标,确保跨不同芯片平 台及异构环境的测试结果具有可比性。其内嵌的数据可视化引擎直观呈现芯片性能差异,结果一目了 然。此外,强大的自动化日志解析技术有效解决了海量压测日志需人工耗时汇总与格式整理的痛点。 截至目前,中移齐鲁创新院已成功利用"迅测"工具,完成了DeepSeek系列大模型在天数智芯、华为昇 腾、壁仞科技、瀚博半导体等多个主流国产计算平台上的 ...
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research
量子位· 2025-06-06 04:01
WebDancer团队 投稿 量子位 | 公众号 QbitAI 能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。 通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。 WebDancer 通过系统化的训练范式——涵盖从数据构建到算法设计的全流程——为构建具备长期信息检索能力的智能体提供了明确路径。 同时,该框架也为在开源模型上复现Deep Research系统提供了可行的指导。团队将进一步在更开放的环境中、结合更多工具,持续拓展和 集成Agentic能力,推动通用智能体的落地与演进。 一、背景:信息检索的新需求与挑战 在信息爆炸的时代,传统的搜索引擎已难以满足用户对深层次、多步骤信息获取的需求。从医学研究到科技创新,从商业决策到学术探索,复 杂问题的解决需要深入的信息挖掘和多步推理能力。这催生了对能够自主思考、自主决策的智能体的需求。 然而,构建这样的智能体面临诸多挑战: 二、突破训练数据难获得问题 在自主信息检索领域,高质量的训练数据至关重要。然而,现有的数据集如2WIKI,HotpotQA多为浅层次问题,难以支持复杂多步推理的训 练需求。 数据过滤 ...
国产替代加速或成长期主线,芯片板块小幅回调,芯片ETF(512760)昨日净流入超5000万元
Mei Ri Jing Ji Xin Wen· 2025-06-06 02:55
消息面上,5月27日中欧半导体上下游企业座谈会在北京召开,商务部、中国半导体行业协会及40余家 中欧企业代表参会,强调深化半导体领域经贸合作,维护全球供应链稳定。 6月6日,芯片板块小幅回调,芯片ETF(512760)昨日净流入超5000万元。 东海证券指出,电子行业需求处于温和复苏阶段,AI推理市场需求高度增长,英伟达一季度数据中心 营收同比增长73%,AI推理token生成量在短短一年内激增10倍。当前国产EDA尚不具备完全替代美系 产品的能力,但长期将推动国产化进程。半导体设备、材料领域国产替代持续加速,1-4月半导体器件 专用设备制造利润同比增长105.1%。行业面临海外技术限制压力,自主可控成为发展主线,建议关注 AIOT、AI驱动、设备材料及消费电子周期筑底板块。 注:指数/基金短期涨跌幅及历史表现仅供分析参考,不预示未来表现。市场观点随市场环境变化而变 动,不构成任何投资建议或承诺。文中提及指数仅供参考,不构成任何投资建议,也不构成对基金业绩 的预测和保证。如需购买相关基金产品,请选择与风险等级相匹配的产品。基金有风险,投资需谨慎。 (文章来源:每日经济新闻) 没有股票账户的投资者可关注国泰CE ...
海天瑞声20250605
2025-06-06 02:37
Q&A 海天瑞声在 2024 年度的财务表现如何? 海天瑞声 20250605 摘要 海天瑞声 2024 年扭亏为盈,归母净利润达 1,134 万元,经营性现金流 净额 2,873 万元,主要受益于多模态数据订单增加、高毛利产品占比提 升及定制服务毛利率改善。公司积极拓展海外市场,尤其在智能驾驶领 域,紧跟车企出海趋势,布局海外数据采集业务,优化智能驾驶数据处 理算法和平台功能。 公司持续投入研发,在智能驾驶数据处理平台、智能化数据运营平台和 Data x 数据中台建设上取得重要进展,并不断增厚算法储备,优化推理 框架,启动语音大模型自研项目,提升点云标注效率,支撑国家人工智 能基础设施建设。 海天瑞声确立科技引领战略,通过持续研发投入突破技术瓶颈,推动训 练数据生产智能化、规模化,重点布局多模态融合、思维链推理等领域, 构建差异化竞争壁垒,如针对自动驾驶点云标注场景提出动静态分类标 注方案。 在智能驾驶标注领域,公司推出多帧点云叠加及物体跟踪算法,提升标 注效率,并逐步向 4D 标注转化,自研 SLAM 算法优化泊车场景 4D 点 云标注,开发智能分段加载解决方案,突破高难度边缘场景标注瓶颈。 2024 年 ...
算力专题:迎接推理需求的爆发
2025-06-06 02:37
算力专题:迎接推理需求的爆发 20250605 摘要 推理需求爆发并非依赖爆款应用,AI 赋能搜索、购物、社交等日常需求 已推动流量增长。海外云厂商如 Google、OpenAI、Meta 正积极融合 AI 与 ToC 应用,提升用户体验,对传统搜索和电商模式形成冲击。 未来两三年,推理需求高速增长将支撑算力板块发展。尽管经历调整, 算力板块反转机会显现。海外模型能力提升,用户体验改善,推动 Gemini、OpenAI 等平台日活用户数显著增长,用户粘性增强。 推理需求爆发主要归因于海外云厂商 AI 赋能应用及模型可用性提升,导 致单用户 TOKEN 消耗量大幅增加。例如,谷歌单月处理 TOKEN 数量 已从 9 万亿增至 48 万亿,推动推理需求增长。 推理时代,ASIC 芯片和交换机环节弹性最大。云厂商自研 ASIC 芯片用 量巨大,Meta、微软、OpenAI 等也将推出自研芯片。推理网络对交换 机和光模块需求量更大,网络架构升级将提高交换机和光模块比例。 沪电股份在交换机领域市占率高,尤其在高端交换机领域占有 60-70% 市场份额,受益于推理网络带动交换机需求增加,800G 产品渗透率提 升,业绩有 ...
AMD收购两家公司:一家芯片公司,一家软件公司
半导体行业观察· 2025-06-06 01:12
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 编译自 AMD 。 AMD 周四证实,已收购 Untether AI 的员工,Untether AI 是一家 AI 推理芯片开发商,其产品 据称比边缘环境和企业数据中心的竞争对手产品速度更快、更节能。 AMD 发言人在一份声明中告诉 CRN:"AMD 已达成战略协议,将从 Untether AI 收购一支优秀 的 AI 硬件和软件工程师团队。" 该代表补充道:"此次交易将为 AMD 带来一支世界一流的工程师团队,致力于提升公司的 AI 编 译器和内核开发能力,并增强我们的数字和 SoC 设计、设计验证和产品集成能力。我们非常高兴 地欢迎该团队以其独特的专业知识加入 AMD。" AMD 发言人拒绝透露该交易的财务细节。 该公司最初的 runAI200 推理加速器采用台积电 16 纳米工艺制造,提供 500 INT8 TOPs 性能、 每瓦 8 TOPs 的能效和 200 MB 的 SRAM。新款"Boqueria"芯片采用台积电 7 纳米工艺制造,具 有 2 petaflops 的 FP8 性能(相当于每瓦 30 teraflops)和 238 MB 的 S ...
优刻得深度报告:从响应DeepSeek看优刻得,云计算价值重估进行时
ZHESHANG SECURITIES· 2025-06-06 00:23
证券研究报告 | 公司深度 | IT 服务Ⅱ 优刻得(688158) 报告日期:2025 年 06 月 05 日 从响应 DeepSeek 看优刻得,云计算价值重估进行时 ——优刻得深度报告 投资要点 ❑ 中国领先的第三方云计算服务商 公司是中国领先的第三方云计算服务商,以 IaaS(计算、存储、网络)、PaaS (数据库、缓存、容器)为核心,持续拓展大数据、人工智能等高附加值产品, 构建了完整的云计算产品矩阵。服务模式分为公有云、混合云与私有云,2024年 分别占收入比例为 50.61%、34.93%、3.50%。其中,公有云客户以移动互联、互 动娱乐、企业服务等互联网客户为主;混合云及私有云客户包括金融、政府机构 等。管理层专业背景深厚,董事长曾获"上海市科学技术奖一等奖"、"中国通 信学会科学技术奖(科技进步类)一等奖"等称号,曾在华为、腾讯等企业任 职,可引领公司快速响应行业变化、把握行业趋势。 ❑ DeepSeek 降低模型部署门槛,云计算厂商受益推理需求增加 DeepSeek 推出 R1 系列模型并遵循 MIT 开源协议,模型参数量仅为 660B,并提 供 1.5B-70B 系列蒸馏模型,大幅度降 ...
电子行业需求温和复苏,半导体产业ETF(159582)冲击3连涨,拓荆科技涨超3%
Sou Hu Cai Jing· 2025-06-05 05:24
Core Insights - The semiconductor industry is experiencing a mild recovery, with significant growth in AI-driven markets and demand for data centers, as evidenced by Nvidia's impressive Q1 performance, which saw a 73% year-over-year increase in data center revenue [3][4] - The semiconductor industry ETF (159582) has shown notable performance, with a 33.93% increase in net value over the past year, ranking in the top 8.67% among equity index funds [4][5] - Recent U.S. export restrictions on semiconductor technology to China have led to increased costs for companies like Nvidia, impacting their financials [3][4] ETF Performance - The semiconductor industry ETF has seen a significant increase in scale, growing by 30.85 million yuan over the past three months, placing it in the top half of comparable funds [4] - The ETF's share count has also increased by 30 million shares in the last six months, indicating strong investor interest [4] - The ETF's year-to-date performance shows a relative drawdown of 0.48% compared to its benchmark, with a Sharpe ratio of 1.11, indicating a favorable risk-adjusted return [5] Top Holdings - The top ten weighted stocks in the semiconductor index account for 75.47% of the index, with North Huachuang (002371) holding the largest weight at 15.51% [5][7] - Other significant holdings include Zhongwei Company (688012) at 12.80% and SMIC (688981) at 11.67%, reflecting a concentration in key players within the semiconductor sector [5][7] - The performance of these stocks varies, with some experiencing slight declines while others, like Tuojing Technology (688072), have seen increases of 3.02% [7]