多模态融合 - filings, earnings calls, financial reports, news

多模态融合

Search documents

工业异常检测新突破，复旦等多模态融合监测入选CVPR 2025

量子位· 2025-06-16 06:59

多模态融合：Real-IAD D³ 的创新之处 Real-IAD D³团队投稿量子位 | 公众号 QbitAI 多模态融合检测，工业异常检测领域新突破！复旦大学、荣旗工业科技、腾讯优图实验室上海交通大学、上海海洋大学等机构联合发布高精度多模态数据集Real-IAD D³，并基于此数据集提出了一种创新的多模态融合检测方法。相关成果已被计算机视觉顶会CVPR 2025收录。在工业生产中，异常检测是确保产品质量和安全的关键环节。然而，现有的异常检测方法在面对复杂工业环境时，常常因为数据集的局限性而难以达到理想的检测效果。为了突破这一瓶颈，研究人员们精心打造了 Real-IAD D³ 数据集，它不仅涵盖了高分辨率的 RGB 图像，还加入了伪 3D 光度立体图像和微米级精度的 3D 点云数据，为异常检测提供了更丰富的信息。 Real-IAD D³数据集的灵感来源于实际的工业质检场景。在真实的工业生产中，质检人员需要快速、准确地识别出产品表面的各种缺陷，如划痕、凹陷、裂缝等。这些缺陷不仅种类繁多，而且在不同的光照和材质背景下，其表现形式也各不相同。传统的2D图像检测方法在面对这些复杂的缺陷时，往往 ...

2025-06-06 02:37

Q&A 海天瑞声在 2024 年度的财务表现如何？海天瑞声 20250605 摘要海天瑞声 2024 年扭亏为盈，归母净利润达 1,134 万元，经营性现金流净额 2,873 万元，主要受益于多模态数据订单增加、高毛利产品占比提升及定制服务毛利率改善。公司积极拓展海外市场，尤其在智能驾驶领域，紧跟车企出海趋势，布局海外数据采集业务，优化智能驾驶数据处理算法和平台功能。公司持续投入研发，在智能驾驶数据处理平台、智能化数据运营平台和 Data x 数据中台建设上取得重要进展，并不断增厚算法储备，优化推理框架，启动语音大模型自研项目，提升点云标注效率，支撑国家人工智能基础设施建设。海天瑞声确立科技引领战略，通过持续研发投入突破技术瓶颈，推动训练数据生产智能化、规模化，重点布局多模态融合、思维链推理等领域，构建差异化竞争壁垒，如针对自动驾驶点云标注场景提出动静态分类标注方案。在智能驾驶标注领域，公司推出多帧点云叠加及物体跟踪算法，提升标注效率，并逐步向 4D 标注转化，自研 SLAM 算法优化泊车场景 4D 点云标注，开发智能分段加载解决方案，突破高难度边缘场景标注瓶颈。 2024 年 ...

Speechocean(SH:688787)

2 1 Shi Ji Jing Ji Bao Dao· 2025-06-05 16:43

这些问题的背后，是制造业对"智能决策"能力的迫切需求。大模型的突破性价值在于其"认知+推理+生成"的三位一体能力。通过训练海量行业数据，大模型不仅能模拟人类工程师的经验判断，还能在复杂工况下自主优化决策路径。例如，在钢铁行业，有大型钢企通过部署行业大模型，某产线采用自动排程编制效率提升40%，轧硬卷周转周期缩短12%，减少返回卷35%，年均增效超千万元。案例揭示了大模型不是简单的工具叠加，而是制造业"知识资产化"的关键载体。大模型在制造业的落地并非简单的技术移植，而是涉及数据治理、算法优化、场景适配的系统工程。从技术实现路径来看，主要呈现以下特征：一是数据驱动的智能决策。制造业积累的海量生产数据（设备运行数据、工艺参数数据、质量检测数据等）为大模型训练提供了丰富素材。通过构建行业知识图谱，大模型能够实现数据的深度关联分析。例如，某化工企业利用大模型对生产过程中的5000+个参数进行实时监控和预测，成功将产品合格率提升至99.8%。这种基于数据的智能决策，使生产过程从"经验驱动"转向"数据驱动"。周城雄（中国科学院科技战略咨询研究院研究员）近日，工业和信息化部召开专题会议，明确提出推动大 ...

AIGC公司融资动态：资本青睐哪些细分领域

Sou Hu Cai Jing· 2025-06-04 11:31

根据-2025年的行业数据及投融资动态，资本在AIGC领域的布局呈现以下细分领域偏好：一、大模型基础层：技术底层的核心战场融资集中度高全球AIGC融资中，.60%流向基础模型研发，中国占比.60%。头部企业如融质科技AI（估值超亿）、月之暗面（Kimi项目）等均获得沙特阿美、红杉中国等顶级资本加持。技术路径差异化企业聚焦GLM（通用语言模型）、多模态融合等技术路径，例如融质科技AI的GLM-B模型和Meta的多模态虚拟人技术。二、虚拟人与多模态生成：商业化落地最快的赛道智能诊断、药物研发等场景获关注，例如DeepMind的蛋白质预测模型AlphaFold。娱乐与营销游戏NPC生成、广告创意自动化等领域，昆仑万维、蓝色光标等企业已布局。市场规模爆发 2025年中国虚拟人核心市场规模预计达.亿元，带动产业规模超亿元。技术涵盖文本、图像、音频生成，应用于虚拟偶像、数字分身等领域。资本布局加速国内企业如倒映有声（AI数字分身）、万兴科技（智能模特方案）已获BAT、字节跳动等投资。三、AIGC+垂直应用：行业赋能的深水区教育领域 2025年全球AIGC+教育融资笔，美国K及职业培训占主导， ...

AIGC

多模态融合

Artificial Intelligence

Artificial Intelligence

GLM - B模型

多模态虚拟人技术

蛋白质预测模型AlphaFold

2025年中国多模态大模型行业核心技术现状关键在表征、翻译、对齐、融合、协同技术【组图】

Qian Zhan Wang· 2025-06-03 05:12

转自：前瞻产业研究院行业主要上市公司：阿里巴巴(09988.HK，BABA.US);百度(09888.HK，BIDU.US);腾讯(00700.HK， TCEHY);科大讯飞(002230.SZ);万兴科技(300624.SZ);三六零(601360.SH);昆仑万维(300418.SZ);云从科技 (688327.SH);拓尔思(300229.SZ)等多模态大模型的核心技术-表征表征学习是多模态任务的基础，其中包含了一些开放性问题，例如：如何结合来源不同的异质数据，如何处理不同模态的不同噪声等级，测试样本的某种模态缺失怎么办。相较于多模态，基于单模态的表征学习已被广泛且深入地研究。在Transformer出现之前，不同模态所适用的最佳表征学习模型不同，例如，CNN广泛适用CV领域，LSTM占领NLP领域。较多的多模态工作仍旧局限在使用N个异质网络单独提取N个模态的特征，之后采用Joint或Coordinated结构进行训练。不过这种思路在很快改变，随着越来越多工作证实Transformer在CV和NLP以及Speech领域都可以获得极佳的性能，仅使用Transformer统一多个模态、甚至 ...

AI医疗进入精准化“深水区” ：OpenAI医疗评估基准落地、大模型加速变革｜AI医疗浪潮㉑

2 1 Shi Ji Jing Ji Bao Dao· 2025-05-17 05:05

21世纪经济报道记者闫硕北京报道近日，OpenAI推出HealthBench开源基准测试，用于衡量大语言模型在医疗健康领域的性能表现与安全可靠性，引发业内广泛讨论。根据官方信息，HealthBench由262位来自60个国家/地区执业的医生共同参与构建，整合了5000段真实的医疗对话数据。与以前的狭窄基准不同，HealthBench通过48562个独特的医生编写的评分标准进行有意义的开放式评估，涵盖多个健康背景和行为维度。有研报分析指出，随着OpenAI推出HealthBench等医疗大模型评估基准的建立和完善，AI医疗模型的性能评估将更加科学、全面，有助于加速AI技术在医疗领域的落地应用，为医疗行业的智能化升级提供有力支持，相关企业有望迎来新的发展机遇。另一方面，大模型本身也在加速变革。事实上，随着大模型竞争的白热化，竞争的焦点也已进入全新阶段：从早先粗放的参数体量堆砌竞赛，转变为模型效率优化与单位算力下的性能提升。 IQVIA艾昆纬战略规划副总监Barrett Li向21世纪经济报道记者表示，随着大模型的不断进化，以及模型优化方法的不断提升，已经为AI在要求更特殊的专业场景中的更 ...

东北证券：多模态融合技术为重要卡点人形机器人传感器赛道迎机遇

智通财经网· 2025-05-12 06:49

智通财经APP获悉，东北证券发布研报称，随着人形机器人智能化升级加速，感知子系统作为其核心"起点"，催生传感器需求持续扩张。当前多模态数据融合质量低等问题制约人形机器人发展，但技术迭代与场景落地正驱动传感器市场高速增长，3D视觉、六维力矩、柔性触觉等细分赛道均呈现高景气趋势。建议关注：1)视觉传感器：凌云光等;2)激光雷达：速腾聚创等;3)IMU：芯动联科、敏芯股份、睿创微纳等;4)力传感器：安培龙、柯力传感等。东北证券主要观点如下：感知子系统是智能化的"起点" 现代机器人系统从算法上可以划分为以下六大子系统：1)感知子系统，2)定位与建图子系统，3)决策与规划子系统，4)运动控制子系统，5)执行器/驱动子系统，6)人机交互与通信子系统。每个子系统各司其职、紧密协作，共同完成"感知—决策—执行"的闭环控制。风险提示：人形机器人发展不及预期，传感器市场竞争格局恶化。内部模态(Proprioceptive)传感器负责反馈机器人本体的运动学和动力学信息，常见包括惯性测量单元 (IMU)、关节/轮速编码器以及力/扭矩传感器;外部模态传感器则用于采集环境的物理与化学特征，以帮助机器人理解周围场景并 ...

Northeast Securities(SZ:000686)

90后清华学霸红海突围，年营收破4亿，小米、OPPO等纷纷下单

创业邦· 2025-03-04 03:02

创业邦100 未来独角兽 FUTURE UNICORNS 这家年轻公司的核心竞争力源于"算法+芯片"的双轮驱动模式。其核心产品是深度学习算法驱动的AI传感芯片，目前已在OPPO、小米、荣耀等众多品牌的手机上搭载。同时极豪科技还拿到了OPPO旗下巡星资本的投资，代表了手机主流品牌的高度认可。极豪科技为什么能突围红海市场，实现这么快的增长速度？ "算法+芯片"，一个全新的市场要说极豪科技，先得从创始人兼CEO陈可卿说起。陈可卿1991年出生于浙江绍兴，高中时夺得全国信息学奥林匹克竞赛金牌，被保送至清华大学读计算机。大二在寻找兼职的实验室研究工作时，学长唐文斌邀请可卿加入了自己创立的旷视科技。在旷视的八年里，陈可卿深度参与Face++云端视觉平台研发，主导vivo X20、小米6等机型的人脸解锁功能，更推动OPPO Find X成为安卓阵营首款量产3D结构光技术的手机。"市面上80%安卓机的人脸解锁背后都有他的影子。"一位前旷视工程师坦言。 છો નૉર્ટ ક્રેસ 作为独角兽的挖掘者、创新的探路者，创业邦连续十六年颁发《创业邦100未来独角兽榜单》，致力于发掘出一批未来1-3年有望成为独角 ...

JFinger Solution极指™算法

JFinger Solution极指™算法

AI传感芯片

从百度的两季创业大赛，看大模型应用风向变化

晚点LatePost· 2024-09-26 09:11

李彦宏认为，智能体相当于 PC 时代的网站和自媒体时代的账号。 ChatGPT 催生大模型热潮将近两年，大模型的能力持续提升，调用价格持续下降，基于大模型开发应用的探索也进入新阶段。 9 月 25 日，第二季百度 "文心杯" 创业大赛结束，8 个团队被选为优胜者，他们将得到百度的数千万元和资源投资。百度称，未来还会在技术、产品、发展战略、资本合作等方面长期支持优胜团队。百度 CEO 李彦宏在颁奖致辞中说，现在大模型最初那种兴奋劲儿逐渐过了，许多创业者可能会失落、迷茫、甚至怀疑未来。"因为人们总是高估技术的短期价值，却低估技术的长期价值。" 李彦宏认为大模型是一次颠覆式的技术革命，长期前景非常乐观，"悲观者永远正确，而未来却是由乐观者创造的"。他说，百度欢迎更多的创业者和开发者加入，一起投身到这场 AI 革命中。在决出优胜者之外，这场举办两年的创业大赛，还提供了一个少见的窗口，可以观察国内大模型应用探索的风向变化：基于大模型开发应用的门槛降低。参赛团队从去年近 1000 支增长到 1600 支，30% 的团队没有专业程序员。应用场景更多元，但开发模式开始聚焦。去年约 30% 的项目在通用办 ...