Workflow
多模态融合
icon
Search documents
工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025
量子位· 2025-06-16 06:59
多模态融合:Real-IAD D³ 的创新之处 Real-IAD D³团队 投稿 量子位 | 公众号 QbitAI 多模态融合检测,工业异常检测领域新突破! 复旦大学、荣旗工业科技、腾讯优图实验室 上海交通大学、上海海洋大学等机构联合发布高精度多模态数据集Real-IAD D³,并基于此数据 集提出了一种创新的多模态融合检测方法。 相关成果已被计算机视觉顶会CVPR 2025收录。 在工业生产中,异常检测是确保产品质量和安全的关键环节。然而,现有的异常检测方法在面对复杂工业环境时,常常因为数据集的局限性而 难以达到理想的检测效果。 为了突破这一瓶颈,研究人员们精心打造了 Real-IAD D³ 数据集,它不仅涵盖了高分辨率的 RGB 图像,还加入了伪 3D 光度立体图像和微 米级精度的 3D 点云数据,为异常检测提供了更丰富的信息。 Real-IAD D³数据集的灵感来源于实际的工业质检场景。在真实的工业生产中,质检人员需要快速、准确地识别出产品表面的各种缺陷,如划 痕、凹陷、裂缝等。这些缺陷不仅种类繁多,而且在不同的光照和材质背景下,其表现形式也各不相同。传统的2D图像检测方法在面对这些 复杂的缺陷时,往往 ...
海天瑞声20250605
2025-06-06 02:37
Q&A 海天瑞声在 2024 年度的财务表现如何? 海天瑞声 20250605 摘要 海天瑞声 2024 年扭亏为盈,归母净利润达 1,134 万元,经营性现金流 净额 2,873 万元,主要受益于多模态数据订单增加、高毛利产品占比提 升及定制服务毛利率改善。公司积极拓展海外市场,尤其在智能驾驶领 域,紧跟车企出海趋势,布局海外数据采集业务,优化智能驾驶数据处 理算法和平台功能。 公司持续投入研发,在智能驾驶数据处理平台、智能化数据运营平台和 Data x 数据中台建设上取得重要进展,并不断增厚算法储备,优化推理 框架,启动语音大模型自研项目,提升点云标注效率,支撑国家人工智 能基础设施建设。 海天瑞声确立科技引领战略,通过持续研发投入突破技术瓶颈,推动训 练数据生产智能化、规模化,重点布局多模态融合、思维链推理等领域, 构建差异化竞争壁垒,如针对自动驾驶点云标注场景提出动静态分类标 注方案。 在智能驾驶标注领域,公司推出多帧点云叠加及物体跟踪算法,提升标 注效率,并逐步向 4D 标注转化,自研 SLAM 算法优化泊车场景 4D 点 云标注,开发智能分段加载解决方案,突破高难度边缘场景标注瓶颈。 2024 年 ...
让大模型从实验室走进产业园
这些问题的背后,是制造业对"智能决策"能力的迫切需求。大模型的突破性价值在于其"认知+推理+生 成"的三位一体能力。通过训练海量行业数据,大模型不仅能模拟人类工程师的经验判断,还能在复杂 工况下自主优化决策路径。例如,在钢铁行业,有大型钢企通过部署行业大模型,某产线采用自动排程 编制效率提升40%,轧硬卷周转周期缩短12%,减少返回卷35%,年均增效超千万元。案例揭示了大模 型不是简单的工具叠加,而是制造业"知识资产化"的关键载体。 大模型在制造业的落地并非简单的技术移植,而是涉及数据治理、算法优化、场景适配的系统工程。从 技术实现路径来看,主要呈现以下特征: 一是数据驱动的智能决策。制造业积累的海量生产数据(设备运行数据、工艺参数数据、质量检测数据 等)为大模型训练提供了丰富素材。通过构建行业知识图谱,大模型能够实现数据的深度关联分析。例 如,某化工企业利用大模型对生产过程中的5000+个参数进行实时监控和预测,成功将产品合格率提升 至99.8%。这种基于数据的智能决策,使生产过程从"经验驱动"转向"数据驱动"。 周城雄(中国科学院科技战略咨询研究院研究员) 近日,工业和信息化部召开专题会议,明确提出推动大 ...
AIGC公司融资动态:资本青睐哪些细分领域
Sou Hu Cai Jing· 2025-06-04 11:31
根据-2025年的行业数据及投融资动态,资本在AIGC领域的布局呈现以下细分领域偏好: 一、大模型基础层:技术底层的核心战场 融资集中度高 全球AIGC融资中,.60%流向基础模型研发,中国占比.60%。头部企业如融质科技AI(估值超亿)、月之暗面(Kimi项目)等均获得沙特阿美、 红杉中国等顶级资本加持。 技术路径差异化 企业聚焦GLM(通用语言模型)、多模态融合等技术路径,例如融质科技AI的GLM-B模型和Meta的多模态虚拟人技术。 二、虚拟人与多模态生成:商业化落地最快的赛道 智能诊断、药物研发等场景获关注,例如DeepMind的蛋白质预测模型AlphaFold。 娱乐与营销 游戏NPC生成、广告创意自动化等领域,昆仑万维、蓝色光标等企业已布局。 市场规模爆发 2025年中国虚拟人核心市场规模预计达.亿元,带动产业规模超亿元。技术涵盖文本、图像、音频生成,应用于虚拟偶像、数字分身等领域。 资本布局加速 国内企业如倒映有声(AI数字分身)、万兴科技(智能模特方案)已获BAT、字节跳动等投资。 三、AIGC+垂直应用:行业赋能的深水区 教育领域 2025年全球AIGC+教育融资笔,美国K及职业培训占主导, ...
2025年中国多模态大模型行业核心技术现状 关键在表征、翻译、对齐、融合、协同技术【组图】
Qian Zhan Wang· 2025-06-03 05:12
转自:前瞻产业研究院 行业主要上市公司:阿里巴巴(09988.HK,BABA.US);百度(09888.HK,BIDU.US);腾讯(00700.HK, TCEHY);科大讯飞(002230.SZ);万兴科技(300624.SZ);三六零(601360.SH);昆仑万维(300418.SZ);云从科技 (688327.SH);拓尔思(300229.SZ)等 多模态大模型的核心技术-表征 表征学习是多模态任务的基础,其中包含了一些开放性问题,例如:如何结合来源不同的异质数据,如 何处理不同模态的不同噪声等级,测试样本的某种模态缺失怎么办。相较于多模态,基于单模态的表征 学习已被广泛且深入地研究。在Transformer出现之前,不同模态所适用的最佳表征学习模型不同,例 如,CNN广泛适用CV领域,LSTM占领NLP领域。较多的多模态工作仍旧局限在使用N个异质网络单独 提取N个模态的特征,之后采用Joint或Coordinated结构进行训练。不过这种思路在很快改变,随着越来 越多工作证实Transformer在CV和NLP以及Speech领域都可以获得极佳的性能,仅使用Transformer统一 多个模态、甚至 ...
AI医疗进入精准化“深水区” :OpenAI医疗评估基准落地、大模型加速变革|AI医疗浪潮㉑
21世纪经济报道记者 闫硕 北京报道 近日,OpenAI推出HealthBench开源基准测试,用于衡量大语言模型在医疗健康领域的性能表现与安全 可靠性,引发业内广泛讨论。 根据官方信息,HealthBench由262位来自60个国家/地区执业的医生共同参与构建,整合了5000段真实的 医疗对话数据。与以前的狭窄基准不同,HealthBench通过48562个独特的医生编写的评分标准进行有意 义的开放式评估,涵盖多个健康背景和行为维度。 有研报分析指出,随着OpenAI推出HealthBench等医疗大模型评估基准的建立和完善,AI医疗模型的性 能评估将更加科学、全面,有助于加速AI技术在医疗领域的落地应用,为医疗行业的智能化升级提供 有力支持,相关企业有望迎来新的发展机遇。 另一方面,大模型本身也在加速变革。事实上,随着大模型竞争的白热化,竞争的焦点也已进入全新阶 段:从早先粗放的参数体量堆砌竞赛,转变为模型效率优化与单位算力下的性能提升。 IQVIA艾昆纬战略规划副总监Barrett Li向21世纪经济报道记者表示,随着大模型的不断进化,以及模型 优化方法的不断提升,已经为AI在要求更特殊的专业场景中的更 ...
东北证券:多模态融合技术为重要卡点 人形机器人传感器赛道迎机遇
智通财经网· 2025-05-12 06:49
智通财经APP获悉,东北证券发布研报称,随着人形机器人智能化升级加速,感知子系统作为其核 心"起点",催生传感器需求持续扩张。当前多模态数据融合质量低等问题制约人形机器人发展,但技术 迭代与场景落地正驱动传感器市场高速增长,3D视觉、六维力矩、柔性触觉等细分赛道均呈现高景气 趋势。建议关注:1)视觉传感器:凌云光等;2)激光雷达:速腾聚创等;3)IMU:芯动联科、敏芯股份、睿 创微纳等;4)力传感器:安培龙、柯力传感等。 东北证券主要观点如下: 感知子系统是智能化的"起点" 现代机器人系统从算法上可以划分为以下六大子系统:1)感知子系统,2)定位与建图子系统,3)决策与 规划子系统,4)运动控制子系统,5)执行器/驱动子系统,6)人机交互与通信子系统。每个子系统各司其 职、紧密协作,共同完成"感知—决策—执行"的闭环控制。 风险提示:人形机器人发展不及预期,传感器市场竞争格局恶化。 内部模态(Proprioceptive)传感器负责反馈机器人本体的运动学和动力学信息,常见包括惯性测量单元 (IMU)、关节/轮速编码器以及力/扭矩传感器;外部模态传感器则用于采集环境的物理与化学特征,以帮 助机器人理解周围场景并 ...
90后清华学霸红海突围,年营收破4亿,小米、OPPO等纷纷下单
创业邦· 2025-03-04 03:02
创业邦100 未来独角兽 FUTURE UNICORNS 这家年轻公司的核心竞争力源于"算法+芯片"的双轮驱动模式。其核心产品是深度学习算法驱动的AI传感 芯片,目前已在OPPO、小米、荣耀等众多品牌的手机上搭载。同时极豪科技还拿到了OPPO旗下巡星资 本的投资,代表了手机主流品牌的高度认可。 极豪科技为什么能突围红海市场,实现这么快的增长速度? "算法+芯片",一个全新的市场 要说极豪科技,先得从创始人兼CEO陈可卿说起。 陈可卿1991年出生于浙江绍兴,高中时夺得全国信息学奥林匹克竞赛金牌,被保送至清华大学读计算 机。大二在寻找兼职的实验室研究工作时,学长唐文斌邀请可卿加入了自己创立的旷视科技。 在旷视的八年里,陈可卿深度参与Face++云端视觉平台研发,主导vivo X20、小米6等机型的人脸解锁功 能,更推动OPPO Find X成为安卓阵营首款量产3D结构光技术的手机。"市面上80%安卓机的人脸解锁背 后都有他的影子。"一位前旷视工程师坦言。 છો નૉર્ટ ક્રેસ 作为独角兽的挖掘者、创新的探路者,创业邦连续十六年颁发《创业邦100未来独角兽榜单》,致力 于发掘出一批未来1-3年有望成为独角 ...
从百度的两季创业大赛,看大模型应用风向变化
晚点LatePost· 2024-09-26 09:11
李彦宏认为,智能体相当于 PC 时代的网站和自媒体时代的账号。 ChatGPT 催生大模型热潮将近两年,大模型的能力持续提升,调用价格持续下降,基于大模型开发 应用的探索也进入新阶段。 9 月 25 日,第二季百度 "文心杯" 创业大赛结束,8 个团队被选为优胜者,他们将得到百度的数千万 元和资源投资。百度称,未来还会在技术、产品、发展战略、资本合作等方面长期支持优胜团队。 百度 CEO 李彦宏在颁奖致辞中说,现在大模型最初那种兴奋劲儿逐渐过了,许多创业者可能会失 落、迷茫、甚至怀疑未来。"因为人们总是高估技术的短期价值,却低估技术的长期价值。" 李彦宏认为大模型是一次颠覆式的技术革命,长期前景非常乐观,"悲观者永远正确,而未来却是由 乐观者创造的"。他说,百度欢迎更多的创业者和开发者加入,一起投身到这场 AI 革命中。 在决出优胜者之外,这场举办两年的创业大赛,还提供了一个少见的窗口,可以观察国内大模型应 用探索的风向变化: 基于大模型开发应用的门槛降低。参赛团队从去年近 1000 支增长到 1600 支,30% 的团队没 有专业程序员。 应用场景更多元,但开发模式开始聚焦。去年 约 30% 的项目在通用办 ...