Workflow
多模态
icon
Search documents
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 12:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM方案。那么下一代大 模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬件适配、知识蒸馏与 量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越多的团队正在从事相 关方向研究。我们了解到不少同学靠着自己的努力,发了篇和自动驾驶相关的大模型工作,申博去了TOP2!前面 收到很多同学的求助,希望能够辅助开展大模型相关的论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人带、易踩坑、不知如 何写稿、投稿的难题。 ⼀、课程介绍⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成为 ...
智谱GLM-4.1V-Thinking登顶HuggingFace Trending全球第一:同尺寸效果最好
IPO早知道· 2025-07-09 10:01
GLM-4.1V-9B-Thinking标志着GLM系列视觉模型实现从感知走向认知的关键跃迁。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 学科解题:支持对数学、物理、生物、化学等学科问题的看图解题,通过推理给出详细的思考过程; 据 IPO 早 知 道 消 息 , GLM-4.1V-9B-Thinking 凭 借 9B 的 模 型 尺 寸 , 日 前 成 功 登 顶 HuggingFace Trending第一 。 | Hugging Face | Q Search models, datasets, users ... | | | | | --- | --- | --- | --- | --- | | Models 1,851,126 | Filter by name | Full-text search | Add filters | 1J Sort: Trending | | THUDM/GLM-4.1V-9B-Thinking | | | | | | 15. Image-Text-to-Text . . . : 10B = Updated about 15 ...
【早鸟票倒计时2天】IRCTC 2025特邀嘉宾(二)重磅揭晓!
机器人圈· 2025-07-09 09:15
详细会议介绍参看往期文章: (点击蓝字跳转) IRCTC 2025报告嘉宾重磅揭晓! 72小时后早鸟票关闭! 截稿延期通知:IRCTC2025九大期刊联合征文延期至7月12日! 刘进长 国家自然基金委高技术中心原研究员 李贻斌 特邀嘉宾 会议期间,数十位重磅嘉宾将带来精彩的主题报告分享。以下是 第二批 特邀嘉宾 名单 : 国家自然基金委高技术中心原研究员,科技部专业技术二级专家,国务院特殊贡献津贴获得者。自1986年起一直从事机 器人技术方面的研究工作,任《机器人技术与应用》杂志主编、中国机器人峰会主席、特种机器人标准委员会副主任、 国家重点研发计划"智能机器人"重点专项主管,被聘为多个国家和省部级重点实验室学术委员会委员。 山东大学机器人研究中心主任 国家重点研发计划"智能机器人"重点专项总体专家组成员 由《机器人技术与应用》杂志社发起,中国自动化学会机器人专业委员会,中国人工智能学会智能机器人专业 委员会、中国仪器仪表学会智能车与机器人专委会和中国工程建设焊接协会机器人及智能焊接专业委员会联合 支持的" 2025智能机器人关键技术大会 "将于 2025年7月22-24日 在 齐齐哈尔市 举办,大会以" 具 ...
模式识别与人工智能前沿探讨专题论坛召开
Huan Qiu Wang Zi Xun· 2025-07-09 08:43
来源:光明网 中国工程院院士、中国自动化学会特聘顾问、湖南大学王耀南教授,华为技术有限公司田奇教授,中国 自动化学会副理事长、清华大学周杰教授,大连理工大学卢湖川教授,北京交通大学于剑教授,清华大 学黄民烈教授,天津大学胡清华教授,华中科技大学白翔教授作专题报告。报告环节由中国科学院自动 化研究所刘成林研究员、赫然研究员和北京大学林宙辰教授共同主持。 田奇教授作题为"面向任意稀疏数据的 3D/4D 内容创建"的报告 王耀南教授作题为"情智兼备的具身智能机器人"的报告 周杰教授作题为"无人系统视觉感知"的报告 7月6日,由中国科学技术协会主办,中国自动化学会承办的第二十七届科协年会"模式识别与人工智能 前沿研讨"专题论坛在北京召开。论坛聚焦国家战略需求与技术前沿动态,汇聚来自国内知名高校、科 研院所及行业领军企业的近20位专家学者与企业代表,深入交流模式识别与人工智能领域的发展方向, 助力新质生产力培育和学科交叉融合,为科研创新和学术期刊协同发展注入新动能。 黄民烈教授作题为"情智兼备的具身智能机器人"的报告 于剑教授作题为"具身模式识别中的理论挑战"的报告 白翔教授作题为"人工智能辅助的甲骨文破译方法"的报告 ...
Nature子刊:多模态AI模型,预测心脏病患者死亡风险
生物世界· 2025-07-09 04:02
撰文丨王聪 编辑丨王多鱼 排版丨水成文 由室性心律失常导致的 心源性猝死 (SCD) 是全球范围内的主要死亡原因之一。 肥厚型心肌病 (HCM) 患者的心律失常死亡预后评估颇具挑战 性, 目前的 临床指南在这一人群中表现出较低的性能和不一致的准确性。 心源性猝死 (SCD) 是全球范围内导致死亡的主要原因之一,也是一个重大的公共卫生问题。在北美和欧洲,SCD 在普通人群中的年发病率为每 10 万人中有 50-100 例。室性心律失常是心源性猝死的主要潜在机制。植入式心脏复律除颤器 (ICD) 能够有效终止心律失常发作,且在预防性植入时,可降低 心律失常导 致的心源性猝死 (SCDA) 高危患者的死亡率。 在这项最新研究中,研究团队提出了一种 AI 模型—— MAARS ( M ultimodal A rtificial intelligence for ventricular A rrhythmia R isk S tratification, 用于 室性心律失常 风险分层的多模态人工智能) ,通过分析多模态医疗数据来预测肥厚型心肌病 (HCM) 患者的致命性心律失常事件。 MAARS 的基于 T ransf ...
申万宏源银河通用投资项目突破融资新纪录
近年来,申万宏源集团深入贯彻落实党的二十届三中全会和中央金融工作会议精神,持续 加大"投早、投小、投硬科技"力度,以长期限股权资金精准支持科技创新企业发展,扎实做好 金融"五篇大文章"。下一步,申万宏源集团将围绕服务新质生产力发展,持续加大对战略新兴 产业和未来产业的投资布局,不断提升服务国家战略效能,在支持实体经济发展过程中展现国 有投资机构的使命担当。 近日,申万宏源集团投资项目——北京银河通用机器人有限公司(以下简称"银河通用") 宣布完成新一轮融资,融资金额人民币11亿元,刷新了具身大模型机器人领域单笔和累计融资 额双纪录。本轮融资由宁德时代及溥泉资本领投,汇聚了国内主流的国资投资平台、战略和产业 投资方及国际知名投资机构。自2023年5月成立,银河通用累计融资规模超过24亿元,获得市 场化投资机构、产业资本、科研机构基金以及国资投资平台的高度认可。 银河通用专注于具身多模态大模型通用机器人的研发创新。自2024年申万宏源集团投资以 来,银河通用业务发展迅速,于今年三月发布全球首个人形机器人智慧药房解决方案,由轮式 双臂机器人Galbot实现药品盘点、补货、取送、打包全流程自动化,支持24小时无人值守 ...
自研多模态触觉传感技术,「模量科技」获千万级天使轮融资|早起看早期
36氪· 2025-07-09 00:02
以下文章来源于硬氪 ,作者张卓倩 硬氪 . 专注全球化、硬科技报道。36kr旗下官方账号。 已实现机器人、灵巧手、工业应用客户商业化订单。 文 | 张卓倩 编辑 | 袁斯来 来源| 硬氪(ID: south_36kr ) 封面来源 | IC photo 36氪获悉,深圳市模量科技有限公司(以下简称 " 模量科技 " )宣布完成由德宁资本投资的千万级天使轮融资,北深资本担任长 期顾问。本轮融资资金将主要用于产品研发、市场推广以及团队建设。 " 模量科技 " 成立于2024年底,是一家专注于多模态多维力触觉传感技术及触觉模型研发与应用的科技公司,其产品包括机器人 触觉、工业压力分布检测、织物类柔性传感器以及柔性薄膜传感器等。产品广泛应用于机器人触觉、工业检测(新能源、3C制造 业)、消费电子以及医疗健康等领域。 "模量科技"自研技术(图源/企业) 源于消费电子(智能穿戴、VR/AR)、医疗健康(假肢、手术机器人)、工业自动化(灵巧手、智能检测)及新兴人形机器人产 业的爆发,全球触觉传感器与柔性传感器市场正处于快速发展期,技术迭代与下游应用拓展推动需求持续攀升。 在供应链端, " 模量科技 " 已完成从小批量到大批 ...
机器人赛道狂揽融资!星动纪元、云深处科技、小雨智造、模量科技获资本押注
机器人圈· 2025-07-08 10:36
文章来源:北京星动纪元科技有限公司 ▍具身智能企业 云深处科技完成近5亿元新一轮融资,加速具身智能产业化布局 详细会议介绍参看往期文章: (点击蓝字跳转) IRCTC 2025报告嘉宾重磅揭晓! 72小时后早鸟票关闭! 截稿延期通知:IRCTC2025九大期刊联合征文延期至7月12日! ▍"清华系"具身智能企业星动纪元完成近5亿元A轮融资!鼎晖VGC和海尔资本联投 20 25年7月7日, 具身智能企业 星 动纪元宣布完成 近5亿元 A轮 融资 。 本轮融资由鼎晖VGC和海尔资本联合 领投,厚雪资本、华映资本、襄禾资本、丰立智能等知名财务机构及产业资本跟投,老股东清流资本、清控基金 等机构持续加码。华兴资本担任本轮独家财务顾问。本轮融资将用于人形机器人软硬技术的研发与量产落地 ,推 动"模型-本体-场景数据"闭环飞轮高速运转。 星动纪元成立于2023年8月,是 清华大学 唯一持股 的具身智能企业。从成立起便坚持软硬一体的技术路线,致 力于打造物理世界中的通用智能体 、 交付通用生 产力,从而实现机器人赋能千行百业、走进千家万户的愿景。 文章来源:云深处科技 ▍黎万强出手!滴滴首次重仓!小米系首家具身大模型公司小 ...
全球倒置荧光显微镜市场前15强生产商排名及市场占有率
QYResearch· 2025-07-08 10:07
倒置荧光显微镜是一种特殊设计的显微成像设备,其光学系统采用 "倒置"结构——光源和物镜位于载物台下方,而目镜或相机位于上方。而"荧光"本质 是 标记物受激后释放的特定波长可见光 。这种设计允许直接观察培养皿、培养瓶等容器中的活体样本(如细胞、组织),尤其适合动态生物学研究。 根据 QYResearch 最新调研报告显示,预计 2 030 年全球 倒置荧光显微镜 市场规模将达到 5.05 亿美元,未来几年年复合增长率 CAGR 为 6.54% 。 倒置荧光显微镜 ,全球市场总体规模 全球 倒置荧光显微镜 市场前 15 强生产商排名及市场占有率(基于 2 02 5 年调研数据;目前最新数据以本公司最新调研数据为准) 全球范围内, 倒置荧光显微镜 主要生产商包括 Leica Microsystems 、 Nikon Instruments 、蔡司、 Keyence 和 Evident 等,其中前五大厂商占有大约 82.39% 的市场份额。目前,全球核心厂商主要分布中国、日本等地。 倒置荧光显微镜 ,全球市场规模,按产品类型细分,三目镜处于主导地位 就产品类型而言,目前 三目镜 是最主要的细分产品,占据大约占 77% ...
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
量子位· 2025-07-08 07:30
MMSearch-R1团队 投稿 量子位 | 公众号 QbitAI 多模态模型学会"按需搜索"! 字节&NTU最新研究, 优化 多模态模型搜索策 略 —— 通过搭建网络搜索工具、构建多模态搜索数据集以及涉及简单有效的奖励机制,首次尝试 基于端到端强化学习的多模态模型自主搜索训练 。 经过训练的模型能够自主判断搜索时机、搜索内容并处理搜索结果,在真实互联网环境中执行多轮按需搜索。 实验结果表明,在知识密集型视觉问答任务 (Visual Question Answering, VQA) 中,MMSearch-R1系统展现出显著优势: 其性能不仅超越同规模模型在传统检索增强生成 (RAG) 工作流下的性能,更 在减少约30%搜索次数的前提 下 , 达 到了更大规模规模模 型做传统RAG的性能水平。 下文将详细解析该研究的研究方法以及实验发现。 具体怎么做到的? 近年来,随着视觉-语言训练数据集在规模和质量上的双重提升,多模态大模型 (Large Multimodal Models, LMMs) 在跨模态理解任务中 展现出卓越的性能,其文本与视觉知识的对齐能力显著增强。 然而,现实世界的信息具有高度动态性和复杂性,单 ...