Workflow
多模态大模型
icon
Search documents
报名开启|7月27日,世界人工智能大会腾讯论坛邀您共探AI新纪元
腾讯研究院· 2025-07-11 07:20
2025年,人工智能将如何进一步突破认知的极限?又将怎样更深刻地助力千行百业,并塑造我们共同的 科技未来? 7月27日,由世界人工智能大会组委会指导, 腾讯华东总部、腾讯优图实验室主办,腾讯研究院、腾讯 科技、腾讯云智能、腾讯Robotics X实验室、腾讯SSV为村发展实验室、腾讯游戏VISVISE、QQ浏览 器、ima及搜狗输入法 等共同支持的 2025世界人工智能大会腾讯论坛 将在 上海 举办。 当科技的浪潮奔涌向前,人工智能正以超乎想象的速度重塑世界。从早期的理论设想,到如今成为变革 世界的核心力量,AI 不再是高悬于科幻云端的概念,已然化作 生活中无处不在的贴心助手 ,驱动着产 业升级、革新用户体验、重构人机协同,在诸多领域展现出令人瞩目的突破性潜能。 2024 年,我们共同经历了生成式AI的深化融合与爆发式应用。以多模态大模型和具身智能为代表的科 技新范式不断涌现,不仅拓宽了AI能力的边界,更深层次地加速了智能与人类社会的共生进程,为人工 智能的发展书写激动人心的新篇章。 今年, 我们将以"智能涌现"为主题, 聚焦全球AI技术与产业深度融合趋势,围绕"大模型垂直落地、场 景创新突破、生态共建协同" ...
科创AIETF(588790)上涨1.78%,近一年日均成交额跑赢同类产品,机构:多模态大模型和应用发展的奇点将至
Xin Lang Cai Jing· 2025-07-11 05:43
消息面上,2025年7月8日至11日,人工智能向善全球峰会在瑞士日内瓦召开。中国移动展示了九天大模型平台等AI解决方案。该平台可实现云端、边缘 侧、端侧全场景灵活部署,已在客服、航空等多个领域落地。同时,还展示了"AI+高标准农田""AI+超脑平台"等应用,助力农业生产与城市治理。 华泰证券认为,多模态大模型和应用发展的奇点将至。判断依据包括:1)技术进步方面:原生多模态模型架构得到业界认可,OpenAI和Google的原生多模 态模型已经在性能、延时、部署上展现出优势。2)商业化进展方面:全球维度看,除了最头部的OpenAI和Anthropic依靠模型"智能"实现商业化,相当一部 分AI应用公司的商业化产品依赖多模态能力。国内维度看,国内公司在视频生成赛道已经实现了较成熟的全球化和商业化之路。与市场不同的观点在于, 1)更早认识到原生多模态架构将成为主流;2)AI商业化不能仅聚焦在二级公司,更要关注全球维度一级公司的进展。 规模方面,科创AIETF最新规模达44.48亿元,创成立以来新高,位居可比基金1/7。 份额方面,科创AIETF最新份额达79.33亿份,创成立以来新高,位居可比基金1/7。 资金流入方 ...
ICML 2025 Spotlight | 快手、南开联合提出模块化双工注意力机制,显著提升多模态大模型情感理解能力!
AI前线· 2025-07-11 05:20
"情智兼备"是新一代人工智能的重要发展方向,是迈向通用人工智能的关键一步。在人机交互场景中,具备情智的数字人与机器人需要精准解译多模态 交互信息,深度挖掘人类内在情感状态,从而实现更具真实感与自然性的人机对话。然而,面对多模态情感数据语义的高度复杂性,如何有效建模跨模 态关联关系仍是领域内亟待突破的核心挑战。 针对这一技术瓶颈,快手可灵团队与南开大学在「多模态情感理解」领域完成了开创性研究,成功定位了现有多模态大模型在情感线索捕捉中的关键短 板。研究团队从多模态注意力机制的维度切入,提出了新的模块化双工注意力范式,并基于此构建了一个涵盖感知、认知与情感能力的多模态模型'摩达 (MODA)'。该模型在通用对话、知识问答、表格处理、视觉感知、认知分析和情感理解等六大类任务的 21 个基准测试中均实现了显著性能提升。此 外,基于新的注意力机制,'摩达'在角色剖析与规划演绎等人机交互场景中表现出色。目前,该研究成果已被 ICML 2025 收录,并获选焦点论文 (Spotlight,Top 2.6%)。 论文标题:MODA: MOdular Duplex Attention for Multimodal Percep ...
全球最强AI模型?马斯克发布Grok 4!重仓国产AI产业链的589520单日吸金3922万元!
Xin Lang Ji Jin· 2025-07-11 01:17
市场分析人士指出,投资人工智能行业要亲身感受时代红利,关注其长期投资价值。当前人工智能技术 发展迅速,应用场景不断拓展,从长远来看,有望持续推动相关企业业绩增长,为投资者带来长期投资 回报。 【国产替代之光,科创自立自强】 乘风AI热潮,全球大模型百花齐放,国产DeepSeek实现弯道超车,打破海外算力封锁,奠定了国产AI 公司后来居上的基石。重点布局在国产AI产业链、具备较强国产替代特点的科创人工智能ETF华宝 (589520),其标的指数均衡配置应用软件、终端应用、终端芯片、云端芯片四大环节,有望受益于端 侧芯片/软件AI化进程提速。 7月10日,马斯克旗下人工智能公司xAI发布Grok 4,该模型在"人类的最后考试"(Humanity's Last Exam)取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,被 称为"世界上最强AI模型"。 华泰证券指出,多模态大模型和应用发展的奇点将至,相当一部分Al应用公司的商业化产品依赖多模态 能力,多模态有望在算力和应用两方面带来相关投资机会。 对AI产业而言,诸如DeepSeek等行业热点的出现 ...
端到端VLA这薪资,让我心动了。。。
自动驾驶之心· 2025-07-10 12:40
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 端到端自动驾驶 - 下一代智能驾驶量产核心算法 端到端自动驾驶(End-to-End Autonomous Driving)作为目前智驾量产的核心算法,可以分为一段式端到端、二段式端到端两个大的技术方向。自UniAD获得 CVPR Best Paper以来,正式拉开了国内新一轮的智驾军备竞赛。 2024年理想汽车更是宣布E2E+VLM的双系统架构量产! 端到端自动驾驶通过传感器数据输入 (视觉/Lidar等)直接输出自车规划或控制信息,是目前智能驾驶最具代表性的方向。 目前VLM/VLA也是招聘的刚需,3-5年就能冲击百万年薪! 而随着学术界和工业界的目光投向端到端这个技术领域,我们发现了很多问题。UniAD是端到端的最终解吗?显然不是!一系列算法如雨后春笋般冒出: 技术栈多?入门困难? 去年我们推出了《首个面向工业级的端到端算法与实战教程》,今年很多小伙伴反馈技术发展太快了,先前的技术方案已经不适合当下的大环境。端到端目前发 展出多个领域技术的方向,需要掌握多模态大模型、BEV感知、强化学习、视觉Trans ...
商汤科技李星冶:多模态大模型“所见即所得”让人机交互更顺畅
Bei Ke Cai Jing· 2025-07-10 11:49
Core Insights - The article discusses the evolution of artificial intelligence from 1.0 to 2.0, highlighting SenseTime's breakthroughs in multimodal interaction technology and its applications across various sectors [1][2]. Group 1: AI Evolution - SenseTime has transitioned from focusing on computer vision in the AI 1.0 era to promoting multimodal interaction innovations in the AI 2.0 era, driven by the rise of large model technologies in 2023 [1]. - The concept of "seeing is believing" is emphasized, integrating video, images, and voice to enable real-time interaction with humans [1]. Group 2: Applications in Education - In the education sector, SenseTime collaborates with learning device manufacturers to develop interactive devices that utilize real-time algorithms to assist children in solving problems and recognizing errors [2]. - The system supports interactive storytelling for young children by converting images into narratives, and SenseTime has partnered with around 10 schools to create smart campus assistants for managing course schedules and grade inquiries [2]. Group 3: Intelligent Applications - SenseTime's intelligent applications include algorithms that analyze industry data to assist in warehouse leasing scenarios and generate lease management solutions [2]. - In customer service, SenseTime collaborates with well-known operators to create efficient intelligent agents, and in smart home applications, it enhances family interaction through AI technology [2]. - The advantage of multimodal large models lies in enabling smoother interactions beyond text command recognition, utilizing visual and multidimensional information [2].
有几个Top具身公司的大模型、强化学习、VLA和具身导航岗位!
具身智能之心· 2025-07-10 03:36
最近和几家公司对接了下,有一些大模型、强化学习、导航相关的职位需求,这里也和大家分享 下。职位比较靠谱,是具身领域的独角兽公司,资金充裕,感兴趣的同学可以底部扫码了解更多。 1)多模态大模型 base:北京、深圳 薪资:40k-80k/月 2.具有机器人感知/导航/操作、AI大语言模型/多模态大模型等领域丰富的从业经验; 3.了解具身智能领域前沿的VLM/VLN/VLA多模态模型算法,对于比较有挑战性的实际问题有自己的 判断和分析解决能力; 4.具有NaVid/MobilityVLA等将多模态大模型技术应用于机器人导航领域的算法研发及落地经验者优 先; 5.扎实的前沿算法研发与高效的工程实现能力,具备技术快速落地的能力; 方向:移动操作、导航、VLA等; 职位描述: 1.从事具身智能多模态大模型前沿算法研发,应用于室内外多个场景的移动操作平台。包括但不限于 具身智能大模型的框架设计、模型优化、面向导航和操作等下游任务的训练和部署等; 2.探索并推动大语言模型和多模态大模型在机器人领域的技术和Demo。 职位要求: 1.计算机科学、人工智能、机器人、控制工程等相关专业硕士及以上学历; 6.具有良好的团队合作能力 ...
华泰证券今日早参-20250710
HTSC· 2025-07-10 01:44
Core Insights - The report highlights a potential narrowing of the decline in PPI in the second half of 2025, with June CPI showing a slight improvement to 0.1% year-on-year, compared to a previous value of -0.1% [2] - Global manufacturing PMI has rebounded above the growth line, indicating an overall recovery in manufacturing activity, particularly in developed economies [2] - The report emphasizes the importance of monitoring the performance of various sectors, particularly those expected to benefit from the "anti-involution" policies and improving economic conditions [4] Macroeconomic Overview - June CPI in China improved to 0.1% year-on-year, while PPI decreased by 3.6% year-on-year, indicating a mixed inflationary environment [2] - Global manufacturing PMI showed a notable increase, with developed markets improving while some emerging markets like Vietnam and Indonesia showed marginal declines [2] Sector Analysis Fixed Income - The report discusses the impact of "anti-involution" policies on PPI and CPI, suggesting a potential stabilization in prices, with CPI expected to rise slightly to around 0.5% by Q4 2025 [5] - The report notes that the demand side remains critical for price elasticity, with industry self-discipline and private enterprise willingness being key factors [5] Machinery and Equipment - The report indicates a recovery in excavator sales, with June sales reaching 18,800 units, a year-on-year increase of 13.3%, driven by strong export growth [8] - The growth in second-hand excavator exports is expected to stimulate domestic replacement demand, benefiting leading companies in the sector [8] Agriculture - The report highlights ongoing "anti-involution" efforts in the pig farming industry, which may lead to inventory release and improved profitability for high-quality pig farming companies [9] - The report suggests that the pig farming sector may gradually transition to a phase of high-quality competition, with recommendations for companies like Muyuan Foods and Wens Foodstuffs [9] Renewable Energy and Equipment - The report anticipates strong growth for offshore wind energy, with a significant increase in orders expected to drive performance for leading companies in the sector [19] - The report emphasizes the importance of technological advancements and capacity expansion in the offshore wind sector [19] Electronics and Chemicals - The report forecasts a substantial increase in net profit for Shengquan Group in the first half of 2025, driven by strong demand for electronic materials [20] - The report maintains a positive outlook on the company's growth trajectory, supported by favorable market conditions [20] Company-Specific Insights - Zhaojin Mining is rated as a "buy" with a target price of 23.44 HKD, driven by expected production growth and favorable gold price trends [15] - Harbin Electric is also rated as a "buy," with anticipated recovery in equipment demand across various energy sectors [15] - MGM China is highlighted for its strong performance in the non-gaming segment, benefiting from increased tourist traffic and successful entertainment events [17]
模式识别与人工智能前沿探讨专题论坛召开
Huan Qiu Wang Zi Xun· 2025-07-09 08:43
来源:光明网 中国工程院院士、中国自动化学会特聘顾问、湖南大学王耀南教授,华为技术有限公司田奇教授,中国 自动化学会副理事长、清华大学周杰教授,大连理工大学卢湖川教授,北京交通大学于剑教授,清华大 学黄民烈教授,天津大学胡清华教授,华中科技大学白翔教授作专题报告。报告环节由中国科学院自动 化研究所刘成林研究员、赫然研究员和北京大学林宙辰教授共同主持。 田奇教授作题为"面向任意稀疏数据的 3D/4D 内容创建"的报告 王耀南教授作题为"情智兼备的具身智能机器人"的报告 周杰教授作题为"无人系统视觉感知"的报告 7月6日,由中国科学技术协会主办,中国自动化学会承办的第二十七届科协年会"模式识别与人工智能 前沿研讨"专题论坛在北京召开。论坛聚焦国家战略需求与技术前沿动态,汇聚来自国内知名高校、科 研院所及行业领军企业的近20位专家学者与企业代表,深入交流模式识别与人工智能领域的发展方向, 助力新质生产力培育和学科交叉融合,为科研创新和学术期刊协同发展注入新动能。 黄民烈教授作题为"情智兼备的具身智能机器人"的报告 于剑教授作题为"具身模式识别中的理论挑战"的报告 白翔教授作题为"人工智能辅助的甲骨文破译方法"的报告 ...
申万宏源银河通用投资项目突破融资新纪录
近年来,申万宏源集团深入贯彻落实党的二十届三中全会和中央金融工作会议精神,持续 加大"投早、投小、投硬科技"力度,以长期限股权资金精准支持科技创新企业发展,扎实做好 金融"五篇大文章"。下一步,申万宏源集团将围绕服务新质生产力发展,持续加大对战略新兴 产业和未来产业的投资布局,不断提升服务国家战略效能,在支持实体经济发展过程中展现国 有投资机构的使命担当。 近日,申万宏源集团投资项目——北京银河通用机器人有限公司(以下简称"银河通用") 宣布完成新一轮融资,融资金额人民币11亿元,刷新了具身大模型机器人领域单笔和累计融资 额双纪录。本轮融资由宁德时代及溥泉资本领投,汇聚了国内主流的国资投资平台、战略和产业 投资方及国际知名投资机构。自2023年5月成立,银河通用累计融资规模超过24亿元,获得市 场化投资机构、产业资本、科研机构基金以及国资投资平台的高度认可。 银河通用专注于具身多模态大模型通用机器人的研发创新。自2024年申万宏源集团投资以 来,银河通用业务发展迅速,于今年三月发布全球首个人形机器人智慧药房解决方案,由轮式 双臂机器人Galbot实现药品盘点、补货、取送、打包全流程自动化,支持24小时无人值守 ...