推理

Search documents
AI推理成本降低推动应用繁荣,消费电子板块午后上行,消电ETF(561310)涨超1%
Mei Ri Jing Ji Xin Wen· 2025-06-05 05:06
Group 1 - The core viewpoint of the article highlights that the reduction in AI inference costs is driving application prosperity, with significant potential for edge AI, particularly in devices like headphones and glasses [1] - The consumer-grade AR glasses, Thunderbird X3 Pro, equipped with full-color Micro-LED light engines, indicate a faster commercialization of display technology [1] - Financial reports from overseas companies show that AI inference has become a new growth engine, with data center business surging, leading to increased value in servers, optical modules, and other related sectors [1] Group 2 - Storage prices have bottomed out and are beginning to recover, while the utilization rate in the packaging and testing segment is gradually increasing [1] - Domestic equipment is making continuous breakthroughs in advanced processes, with the expansion of advanced processes becoming a key focus for self-control in the industry, particularly in CoWoS and HBM positioning within the AI industry trend [1] - The Consumer Electronics ETF (code: 561310) tracks the consumer electronics index (code: 931494), which includes listed companies involved in the manufacturing and sales of consumer electronics products, focusing on segments like smartphones, wearable devices, and smart home products [1]
东海证券晨会纪要-20250605
Donghai Securities· 2025-06-05 02:56
[Table_Reportdate] 2025年06月05日 [证券分析师: Table_Authors] 张季恺 S0630521110001 zjk@longone.com.cn 证券分析师: 王洋 S0630513040002 wangyang@longone.com.cn 证券分析师: 刘思佳 S0630516080002 liusj@longone.com.cn 联系人: 花雨欣 hyx@longone.com.cn [晨会纪要 Table_NewTitle] 20250605 [table_summary] 重点推荐 财经要闻 晨 会 纪 要 证券研究报告 HTTP://WWW.LONGONE.COM.CN 请务必仔细阅读正文后的所有说明和声明 ➢ 1.英伟达Q1数据中心业务成绩亮眼,美限制EDA龙头对华提供服务——电子行业周报 2025/5/26-2025/6/1 ➢ 2.关注陆家嘴论坛政策发布预期带来的市场情绪催化——非银金融行业周报(20250526- 20250601) ➢ 1.四部门组织开展人力资源服务业与制造业融合发展试点工作 ➢ 2.美国ISM服务业PMI大幅回落,跌至50荣枯线以下 ...
奥特曼:假如给我一千倍算力,我会这样做
量子位· 2025-06-04 07:04
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 完美的人工智能是"一个拥有超人推理能力、1万亿个上下文标记并可以使用你能想到的所有工具的微型模型"。 这是 奥特曼 在最新的访谈中对下一代模型的展望。 他表示,理想中的AGI不需要包含知识——只需要思考、搜索、模拟和解决任何问题的能力。 它应该成为一个能够 自主发现新科学 ,或者成为人类强大工具,使全球科学发现速度提升数倍的系统。 也许到那时,我们可能要 反过来问问AI我们应该怎么做 。 此话一出,有网友表示,奥特曼对AGI的理想倒是始终没有变过:系统能自主探索新的科学发现。 在主持人问到对AGI的定义时,奥特曼表示,不同的人在不同的时期都会对此有不一样的理解。 但也有网友对此表示怀疑,"询问AI该怎么做"就好像把我们手中的钥匙交了出去,令人不安。 访谈中,奥特曼还对一个 一千倍算力 的假设性问题给出了极具概念性的回答。 一起来看看具体内容。 平稳、快速的进步更重要 AGI的定义其实并不重要,重要的是平稳地快速进步。 可能在2020年,人工智能领域的发展还不像如今这样繁荣的时候,如果出现ChatGPT,大多数人可能会认为这就是AGI。 就像这位网友说的,自 ...
视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成
机器之心· 2025-06-03 08:57
在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。 一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。 来自阿里巴巴通义实验室的最新研究成果 ——VRAG-RL(Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning),将强化学习算法引入多模态智能体训练,借助迭代推理和视觉感知空间,全方位提升视觉语言 模型(VLMs)在检索、推理和理解视觉信息方面的能力,为纯视觉检索增强生成任务提供有效解决方案,代码、模型全面开源! Paper 地址:arxiv.org/pdf/2505.22019 Github 地址:https://github.com/Alibaba-NLP/VRAG 为了解决现有 RAG 方法在处理视觉丰富文档时面临的挑战,尤其 ...
推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源
量子位· 2025-06-03 06:21
ZJU REAL Lab 投稿 量子位 | 公众号 QbitAI DeepSeek-R1、OpenAI o1等推理模型大放异彩。但随着能力增强,一个副作用越来越明显—— 这不光影响效率,更可能导致错误 —— 在长链式思考中,每一步的小误差都会累积放大 ,最后可能想着想着就跑偏了。 于是,一个关键问题摆在了现实面前: 如何让模型既然会思考推理,也懂得"适可而止",知道什么时候该停下来? 针对于此,来自浙江大学、天津大学和MSRA的研究团队提出了一个新方法, Self-Braking Tuning (SBT) 。 它是一种轻量级、通用的调优机制,可无缝集成到现有大模型中。其主要目的是让模型不再一味求"多想",而是在最短路径上到达正确答案。 其核心设计包括刹车信号机制、多任务微调,且无需外部模块或改动推理流程。 其中,刹车信号机制是在训练阶段引入一类特殊的信号,指示"当前信息已经足够完成任务",模型据此学习何时应终止推理。 多任务微调则指挥模型同时学习如何解题&何时停步,兼顾准确性与效率。 它们开始想太多了 。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。 也就是说,模型在完成推理任务时, 常常出现过度 ...
AI推理成为新增长引擎,5G通信ETF(515050)蓄力回调,近5日净流入5287万元
Mei Ri Jing Ji Xin Wen· 2025-06-03 03:38
资金关注相关方向补涨机会,近5个交易日,5G通信ETF(515050)获得资金净流入超5287万元。资料 显示,5G通信ETF(515050)跟踪中证5G通信主题指数,是全市场规模最大的5G通信主题ETF,深度 聚焦5G、AI算力、英伟达产业链,覆盖了多个AI算力、6G、消费电子、PCB、通信设备、服务器、光 模块、物联网等细分行业的龙头个股。创业板人工智能ETF华夏(159381)跟踪创业板人工智能指数, 选取创业板上市的AI主业公司,实现AI产业硬件+软件+应用龙头全覆盖,行业分布上,在光模块、IT 服务等概念上的暴露度较高,前十大成分股股包含新易盛、中际旭创、天孚通信三大光模块龙头。 6月3日,AI方向表现分化,网络游戏、金融科技概念活跃。截至11点11分,聚焦AI算力+消费电子终端 的5G通信ETF(515050)跌0.29%,持仓股深南电路、移远通信、领益智造、光库科技等领涨。 近期,AI算力龙头英伟达公布了2026财年第一季度财报,营收达441亿美元,同比增长69%,净利润达 187.75亿美元。核心推动力仍然来自数据中心业务。兴业证券认为,这一板块之所以能持续爆发,主要 得益于AI推理的"主角化 ...
券商晨会精华:低估值具身智能应用标的和红利资产继续受青睐
Xin Lang Cai Jing· 2025-06-03 00:49
Group 1 - The market experienced fluctuations with the ChiNext index leading the decline, while sectors such as pork, innovative drugs, banks, and CROs saw gains, and sectors like gold, glyphosate, controllable nuclear fusion, humanoid robots, environmental equipment, and consumer electronics faced losses [1] - CITIC Securities highlighted that low-valued embodied intelligent application targets and dividend assets continue to attract market interest, suggesting a focus on "AI + robotics" investment opportunities beyond humanoid robots [2] - CICC emphasized that multi-modal reasoning is crucial for enhancing intelligent driving capabilities, with significant advancements expected in the algorithms of leading smart driving companies [2] Group 2 - Huatai Securities pointed out that core assets like A50 and major financial sectors are likely to shift from resilience revaluation to growth revaluation, showing strong fundamentals during the real estate investment cycle adjustment [3] - A50 non-financial ROE is expected to stabilize and recover ahead of the overall non-financial sector, driven by cost improvements and shareholder returns [3] - The current valuation of these companies reflects a higher implied cost of equity than the market average, indicating potential for a significant reduction in risk premium if investors reassess the overlooked growth resilience [3]
中金:多模态推理助力智能驾驶能力升阶,相关主线值得关注
news flash· 2025-06-03 00:32
Core Insights - Google Gemini 2.5 is set to be released in March, enabling multimodal fusion reasoning [1] - Companies such as Starry Sky, SenseTime, and MiniMax have recently launched multimodal reasoning achievements between April and May, indicating significant technological progress [1] - The integration of multimodal thinking chains is leading to a unified architecture for multimodal and reasoning models, enhancing multimodal understanding capabilities [1] Industry Developments - The recent advancements in multimodal reasoning are expected to extend application scenarios, particularly in the automotive sector with companies like Li Auto and NIO implementing multimodal reasoning in user interactions [1] - The ongoing innovation in technological architecture is likely to continue driving the expansion of application scenarios in the industry [1] - The focus on multimodal reasoning as a primary development line is becoming increasingly important [1]
中金 | AI智道(9):多模态推理技术突破,向车端场景延伸
中金点睛· 2025-06-02 23:45
文 / 于钟海 , 魏鹳霏 , 肖楷 , 赵丽萍 中金研究 以MiniMax V-Triune新框架成果为例,推理感知统一框架在可拓展性、泛化性初步验证。 V-Triune以三层组件架构实现视觉推理和感知任务统一至强化学 习框架:1)多模态样本数据格式化;2)验证器奖励计算,采用异步客户端-服务器架构,奖励计算和主训练循环解耦;3)数据源级指标监控,便于溯源 和提升稳定性。结合动态IoU奖励机制、冻结ViT参数等工程优化,Orsta系列模型(32B参数)在MEGA-Bench Core基准测试中实现了最高14.1%的性能提 升。 多模态推理助力智能驾驶能力升阶。 在智能驾驶场景,多模态推理是增强道路交通标志识别判断能力、提升复杂场景泛化性的重要途径,正成为头部智 能驾驶企业算法演进的重点。2025年5月30日,蔚来世界模型NVM首个版本正式开启推送,具备全量理解、想象重构和推理能力,能够对实时环境多模信 息进行理解和推演,在选择最优ETC车道通行、停车场自主寻路等场景的性能提升显著。此外,理想自研的VLA大模型亦具备思维链推理能力,以多模态 推理模拟人类驾驶员的思维运作方式。 图表1:MiniMax多模态RL ...
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
猿大侠· 2025-06-02 04:22
一水 发自 凹非寺 量子位 | 公众号 QbitAI 曾撼动Transformer统治地位的Mamba作者之一 Tri Dao ,刚刚带来新作—— 提出两种专为推理"量身定制"的注意力机制。 在保持模型性能不变的情况下,将解码速度和吞吐量最高提升2倍,大大优化了模型的长上下文推理能力。 这项研究的三位作者均来自普林斯顿大学,论文主要有两大贡献: 其一,提出Grouped-Tied Attention(GTA) ,与已集成到LLaMA 3的注意力机制GQA质量相当,但KV缓存用量减少约50%。 其二,提出Grouped Latent Attention(GLA) ,与DeepSeek所使用的注意力机制MLA质量匹配,但解码速度更快,某些情况下比 FlashMLA快2倍。 按照作者之一Ted Zadouri的总结: GTA是GQA的有效替代品,而GLA是MLA的实用替代品。 一言以蔽之,通过优化注意力机制的 内存使用 和 计算逻辑 ,在不牺牲模型生成质量的前提下,可显著提升大语言模型的推理效率和硬件资 源利用率,尤其在长上下文场景中优势更为突出。 相关论文公布后,一众研究者也赶来祝贺~ | Sara Hooker ...