多模态模型

Search documents
中信建投:多模态产品密集更新,关注WWDC及字节火山大会进展
news flash· 2025-06-09 00:27
中信建投(601066)表示,近期多模态动态更新密集。5月21日,谷歌于2025I/O大会上正式推出Veo3视 频生成模型,实现AI视频音画同步;5月23日,豆包正式上线视频通话功能,支持实时视频交流及屏幕 分享;6月6日,快手宣布可灵AI ARR在2025年3月突破1亿美金,且4月和5月的月度付费金额均突破1亿 人民币。考虑到6月10日苹果WWDC2025及6月11日字节Force2025原动力大会.春即将召开,多模态模型 和端侧AI产品有望加速落地。 ...
当前时点如何看光模块反弹行情
2025-06-06 02:37
当前时点如何看光模块反弹行情 20250605 摘要 英伟达季报显示 Blackwell 产品占一季度收入 70%,部署速度达每周 1,000 架机架,预计二季度部署量超 6,000-10,000 架。GB300 可能 在二季度末出货,从 GB200 切换到 GB300 无太多障碍,采用有限创新 以保证稳健交付,核心变化包括 HBM 配置提升和标配 CX8 网卡。 Mellanox 网络业务超预期,MV link 销售额约 10 亿,ID 和以太坊贡献 10 亿环比增长。收入主要来自交换机、光模块、网卡及 Armlink 协议 授权,这些领域在第一季度有复苏迹象,利好英伟达供应链,如天孚通 信直接受益。 主权国家对 AI 投资超预期,沙特大单已促成,英伟达将在欧洲推动更多 主权 AI 大单。谷歌 IO 大会提到推理需求显著增加,每月 TOKEN 消耗 量达 480 万亿,同比增长 50 倍,支撑推理需求。 博通 Tomahawk 6 提前发布,加速行业迭代。Tomahawk 系列产品从 发布到批量出货通常需一到两年,预计 Tomahawk 6 将在 2026 年下 半年或 2027 年上半年开始规模交付,推动 ...
恺英网络20250531
2025-06-02 15:44
游戏板块整体估值维持在 15-18 倍,暑期档游戏和 AI 应用数据预计表 现良好,多模态模型可能成为催化剂,建议投资者超配游戏板块。 恺英网络在传奇游戏市场占据超过 50%的市占率,通过搭建用户平台和 打造传奇生态延长玩家生命周期,降低投流成本,"传奇盒子"收入显 著增长,日活用户稳步提升。 恺英网络自 2024 年第四季度以来加快新产品上线节奏,包括 SLG 产品 "三国天下归心"、大 IP 产品"大富翁"和"拳皇"等,多款产品预计 在 8-9 月份上线。 恺英网络积极拓展海外业务,已在香港和韩国设立办公室,收购复古情 怀 IP,搭建海外发行平台,2025 年海外业务有望延续高增长态势,重 点关注东南亚市场 RO 仙境传说等 IP 产品。 恺英网络在 AI 领域布局 AI 陪伴、社交应用"IF",女性向产品研发进展 顺利,计划暑期发布 AI 游戏引擎 2.0 版本,并探索 AI 辅助创作的双边 用户平台商业逻辑。 恺英网络还布局了 AI 玩具,如晚安羊和忘忧鸟,并与大鹏眼镜合作探索 AI 眼镜生态。 恺英网络 20250531 摘要 从去年(2024 年)第四季度至今,恺英网络的新产品上线节奏明显加快。例 ...
MiniMax正暗戳戳憋大招
Hu Xiu· 2025-06-01 22:09
出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 相比之下,MiniMax选择了一种折中方案:其在国内的C端应用(MiniMax)上坚持不接入DeepSeek,只在海外的AI应用上选择接入DeepSeek。而有多位业 内人士向虎嗅表示,"MiniMax在今年1月15日推出的01虽然并没有被官方定义为推理模型,但业界已有人用其Linear架构开展过深度推理的实验。"只不过对 于MiniMax来说,还并没有一款真正意义上的推理模型问世。(虎嗅注:2025年1月15日MiniMax发布MiniMax-01并正式开源,首次尝试使用线性注意力架 构Linear Attention)这意味着它即将推出的推理模型将成为关键。 有业内人士向虎嗅分析认为,如果MiniMax的推理模型达到甚至超过业内预期,那么外界对其信心将加强会认为其"并未掉队"。也有行业资深人士认为在六 小虎之中MiniMax的推理模型问世时间虽然比部分友商稍晚,但这家公司素来有自己独特的产品节奏和布局。 一个潜在的挑战是,环境已变。 2025年上半年,大模型圈内"AI六小虎"(即智谱 AI、月之暗面、百川智能、MiniMax、阶跃星辰和零一万物)的说法逐渐不再 ...
OpenAI未公开的o3「用图思考」技术,被小红书、西安交大尝试实现了
机器之心· 2025-05-31 06:30
OpenAI 推出的 o3 推理模型,打破了传统文字思维链的边界 —— 多模态模型首次实现将图像直接融入推理过程。它不仅 "看图",还能 "用图思考",开启了视觉与 文本推理深度融合的问题求解方式。例如,面对一张物理试卷图像,o3 能自动聚焦公式区域,分析变量关系,并结合知识库推导出答案;在解析建筑图纸时,o3 可在推理过程中旋转或裁剪局部结构,判断承重设计是否合理。这种 "Thinking with Images" 的能力,使 o3 在视觉推理基准测试 V* Bench 上准确率飙升至 95.7%,刷新了多模态模型的推理上限。 然而,OpenAI 如何赋予 o3 这一能力,学界和工业界仍不得而知。为此, 小红书团队联合西安交通大学, 采用端到端强化学习,在完全不依赖监督微调(SFT) 的前提下,激发了大模型 "以图深思" 的潜能, 构建出多模态深度思考模型 DeepEyes,首次实现了与 o3 类似的用图像进行思考的能力,并已同步开源相关技术细 节,让 "用图像思考" 不再是 OpenAI 专属。 论文地址:https://arxiv.org/abs/2505.14362 项目地址:https://visu ...
粤开市场日报-20250522
Yuekai Securities· 2025-05-22 08:39
证券研究报告 | 策略点评 2025 年 05 月 22 日 投资要点 分析师:孟之绪 执业编号:S0300524080001 电话: 邮箱:mengzhixu@ykzq.com 投资策略研究 粤开市场日报-20250522 今日关注 指数涨跌情况:今日 A 股主要指数多数收跌。截止收盘,沪指跌 0.22%,收报 3380.19 点;深证成指跌 0.72%,收报 10219.62 点;科创 50 跌 0.48%,收报 990.71 点;创业板指跌 0.96%,收报 2045.57 点。总体上,全天个股跌多涨 少,Wind 数据显示,全市场 4451 只个股下跌,882 只个股上涨,77 只个股收 平。沪深两市今日成交额合计 11027 亿元,较上个交易日缩量 707.55 亿元。 行业涨跌情况:今日申万一级行业除银行、传媒、家用电器外全部下跌,美 容护理、社会服务、基础化工、环保、房地产、电力设备等行业领跌。 板块涨跌情况:今日涨幅居前概念板块为银行精选、智能音箱、多模态模型、 央企银行、ChatGPT、网络游戏、K-12 教育、航空运输精选、Kimi、保险精 选、IGBT、中文语料库、短剧游戏、网红经济、央 ...
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
3 6 Ke· 2025-05-22 08:01
作者 | 邓咏仪 2025年初,混元TurboS正式发布,采用大规模混合Mamba-MoE模型,其在效果与性能上已展现出显著优势。而这一最新突破,则得益于预训练阶段的tokens 增训,以及后训练阶段引入长短思维链融合技术,使得TurboS理科推理提升超10%,代码能力提升24%,竞赛数学成绩大幅提升了39%。 编辑 | 苏建勋 腾讯大模型的战略落地上正不断提速。 "AI持续落地,每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'。"5月21日,腾讯云AI产业应用峰会上,腾讯集团高级执行副总裁、云与智 慧产业事业群CEO汤道生表示。 5 月 21 日,腾讯混元迎来了一次全面升级,其中包括旗舰快思考模型混元TurboS、深度思考模型混元T1都发布了新的迭代版本。 基于TurboS基座,腾讯新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。在腾讯AI产业应用峰会上,混元图像2.0、混元3D v2.5及混元游 戏视觉生成等一系列多模态模型,也同步上新。 汤道生 来源:腾讯 腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,在全球公认的权威大语言模型评测平台Chatbo ...
联想集团ISG业务连续两季度盈利 Q4营收同比增长63%
Ge Long Hui· 2025-05-22 05:37
IDC预计2025年全球基础设施市场将增长18%,达到2650亿美元,其中,AI服务器2025年市场规模将达 到1472亿美元,2024年-2027年复合年增长率将达到18%。这意味着,随着生成式AI和多模态模型的加 速落地,企业级AI基础设施投入将持续释放,相关算力、存储解决方案需求同步扩张,为基础设施方 案厂商带来广阔的发展空间。 5月22日,联想集团(HKSE:992)公布截至2025年3月31日的2024/25财年第四季度及全年业绩。全年营 收达到4985亿元人民币,实现同比21.5%的强劲增长,创历史第二高位,盈利提升更快,同比增长 36%。第四季度,ISG实现营收299.6亿人民币,同比增长63%,并连续第二个季度实现盈利。其中,中 国市场营收同比增长113%,海神液冷解决方案收入同比大增244%。 报告期内,联想发布新一代ThinkSystem V4服务器、ThinkEdge SE100 入门级AI推理服务器,提供多样 化解决方案;第六代Neptune海神液冷技术的推出,带来40%的能源效率提升;存储产品方面,迎来史 上规模最大的存储产品组合更新,并重磅发布 21 款存储产品及全新的数据存储解决 ...
能空翻≠能干活!我们离通用机器人还有多远? | 万有引力
AI科技大本营· 2025-05-22 02:47
Core Viewpoint - Embodied intelligence is a key focus in the AI field, particularly in humanoid robots, raising questions about the best path to achieve true intelligence and the current challenges in data, computing power, and model architecture [2][5][36]. Group 1: Development Stages of Embodied Intelligence - The industry anticipates 2025 as a potential "year of embodied intelligence," with significant competition in multimodal and embodied intelligence sectors [5]. - NVIDIA's CEO Jensen Huang announced the arrival of the "general robot era," outlining four stages of AI development: Perception AI, Generative AI, Agentic AI, and Physical AI [5][36]. - Experts believe that while progress has been made, the journey towards true general intelligence is still ongoing, with many technical and practical challenges remaining [36][38]. Group 2: Transition from Autonomous Driving to Embodied Intelligence - Many researchers from the autonomous driving sector are transitioning to embodied intelligence due to the overlapping technologies and skills required [17][22]. - Autonomous driving is viewed as a specific application of robotics, focusing on perception, planning, and control, but lacks the interactive capabilities needed for general robots [17][19]. - The integration of expertise from autonomous driving is seen as a bridge to advance embodied intelligence, enhancing technology fusion and development [18][22]. Group 3: Key Challenges in Embodied Intelligence - Current robots often lack essential capabilities, such as tactile perception, which limits their ability to maintain balance and perform complex tasks [38][39]. - The operational capabilities of many humanoid robots are still in the demonstration phase, lacking the ability to perform tasks in real-world contexts [38][39]. - The complexity of high-dimensional systems poses significant challenges for algorithm robustness, especially as more sensory channels are integrated [39]. Group 4: Future Applications and Market Focus - The focus for developers should be on specific application scenarios rather than pursuing general capabilities, with potential areas including home care and household services [48]. - Industrial applications are highlighted as promising due to their scalability and the potential for replicable solutions once initial systems are validated [48]. - The gap between laboratory performance and real-world application remains significant, necessitating a focus on improving system accuracy in specific contexts [46][47].
能空翻≠能干活,我们离通用机器人还有多远?
3 6 Ke· 2025-05-22 02:28
具身智能,作为近年来人工智能领域的热点之一,成为产业界和学术界重点关注的方向。特别是在人形机器人这个载体上,它所承载的感知、运 动、决策等能力,让具身智能从概念逐渐走向落地。但与此同时,也有不少值得深入探讨的问题浮出水面:为什么具身智能的发展似乎格外偏 爱"人形"?是否只有模仿人类形态,才是实现智能的最佳路径?在面对数据、算力、模型架构等现实挑战时,我们究竟处于怎样的阶段?距离真 正的通用机器人,还有多少"里程"要走? 基于此,CSDN《万有引力》栏目特别策划了一期以"十问具身智能:我们离通用机器人还有多远?"为主题的深度对话,邀请了北京邮电大学人 工智能学院副教授陈光@爱可可-爱生活、深圳市人工智能与机器人研究院副研究员夏轩、Roboraction.AI 首席执行官黄浴,在栏目主理人 CSDN &《新程序员》执行总编唐小引主持下,三位专家将从技术演进、研究现状、产业应用等多个角度切入,带大家一同拆解具身智能面临的"关键问 题",看清这条通往未来机器人的发展路径。 夏轩:在专业背景方面,我早期的研究主要集中于计算机视觉领域(CV),涵盖无人机图像处理、工业图像处理以及生成模型等方向。在扩散模 型兴起之前,我也 ...