多模态大模型

Search documents
【前瞻分析】2025-2030年中国多模态大模型生成生活相关场景分析
Sou Hu Cai Jing· 2025-05-14 12:57
行业主要公司:阿里巴巴(09988.HK,BABA.US);百度(09888.HK,BIDU.US);腾讯(00700.HK, TCEHY);科大讯飞(002230.SZ);三六零(601360.SH);云从科技(688327.SH)等 2025年开始投融资呈爆发式增长 截至2025年4月,多模态大模型投融事件数量接近50件,其中国2021年投融资金额出现了高峰,达19.1 亿元,尽管当年投资事件数量为5件。2024年开始新一轮的投资周期,共有11件投资事件,金额达5.16 亿元。2025年前4个月,共有17件投资事件,金额为16亿元,后续多模态大模型题材的投资将呈现爆发 式增长。 投资目的地为北京 根据企业投融资目的地来看,目前行业内资金主要流向北京,占全部项目的一半。其次是深圳,占比 10%,上海占比8%。北京具有良好的互联网科技、人工智能产业发展基础,企业对于多模态大模型需求 较高,投资吸引力强。此外还有宁波、三亚、苏州三市的项目,这些地方具有较好的营商环境。 多模态大模型生成生活相关场景 智能营销、教学辅助、3D建模以及智能驾驶等应用场景是生产生活中的重要领域,也是目前多模态大 模型可以切入并且精准赋 ...
国泰海通:具身智能落地打开人形机器人成长空间
智通财经网· 2025-05-14 06:43
多模态、强化学习提升运控性能,感知传感持续革新,通信、算力升级增强实时控制 多模态大模型是提高人机交互效率、增强情景理解力的关键,目前英伟达GR00T、特斯拉Grok3大模型 积极整合多模态感知,加速提升机器人交互及决策精度。 思维链赋能大模型高效推理,GPT-4.5已在一定程度上通过图灵测试,目前优必选基于DeepSeek-R1研发 具身推理大模型,预期可实现复杂环境中的准确高效反应和决策。 运动控制算法是协调全身动作执行核心,强化学习可基于奖励函数实现步态、奔跑等运动高效学习,并 增强泛化能力,有望成为运动算法主要范式。 智通财经APP获悉,国泰海通发布研报称,人形机器人高速发展,具身智能是驱动商业化落地的核心因 素。机器人智能水平以及实时控制性能提升将驱动感知性能、算力、通信效率等需求增长,端侧传感、 驱控及通信芯片将充分受益。具身智能落地打开人形机器人成长空间,未来应用前景广阔,带动整机厂 商业绩上行。高性能多模态大模型发布,运动算法性能突破将成为催化剂。推荐标的:峰岹科技 (688279.SH),奥比中光-UW(688322.SH),创耀科技(688259.SH),华兴源创(688001.SH)。 ...
字节视觉-语言多模态大模型Seed VLM技术报告首次公开
news flash· 2025-05-13 06:16
字节视觉-语言多模态大模型Seed VLM技术报告首次公开 智通财经5月13日电,Seed1.5-VL是字节跳动Seed团队最新发布的视觉-语言多模态大模型,具备更强的 通用多模态理解和推理能力,且推理成本显著降低,在 60 个公开评测基准中的 38 个上取得 SOTA 表 现。目前,Seed1.5-VL 已在火山引擎上开放 API 供用户体验。 ...
云从科技“从容多模态大模型”全球领先,与华为昇腾合作推动解决方案落地
news flash· 2025-05-12 05:48
云从科技自主研发的"从容多模态大模型"在Open Compass评测中以65.5分位列全球前三,超越谷歌 Gemini1.5Pro等模型,并在跨模态跟踪、3D人脸识别等细分领域10次刷新世界纪录。基于这一技术优 势,公司与华为昇腾联合推出的智用一体机解决方案,已在天津港(600717)智慧物流调度、国网山东 能源管理等多个标杆项目中落地,助力企业运营效率提升超20%。(36氪) ...
冯诺依曼研究院成立深港科技合作再添AI范式
2 1 Shi Ji Jing Ji Bao Dao· 2025-05-09 09:45
贾佳亚于2019年创立了工业领军企业思谋科技,深度融合"AI大脑+全栈机器人"技术,并在后续仅用18 个月,便让思谋科技成为一家AI独角兽企业。2024年6月,思谋科技更是成为香港投资管理公司,对外 宣布的首个战略合作企业。目前,思谋已服务近300家全球大型制造业企业。 大湾区首个"实战型"AI研究院 贾佳亚表示,研究院将通过整合、协作及资源汇聚,聚焦五大AI关键领域,包括开发新一代多模态AI 系统,以处理图像、音频及文本等多样化数据;增强AI逻辑推理能力,建立可信赖的解决方案;开发 机器人智能技术,实现模仿人类运动的控制及互动;通过AI驱动的三维(3D)理解与生成,创建贴近 现实的虚拟生态系统;以及利用大模型改革医疗保健服务,提升治疗效果。 在定位上,冯诺依曼人工智能研究院是大湾区首个"全链条实战型"AI研究院。研究院聚焦具身智能、多 模态大模型、可信人工智能、虚实融合空间、医疗AI应用等五大前沿领域,贯通从基础研究到产业落 地的完整技术链条。 这种定位不仅突破传统高校研究院的纯学术模式,更通过设立专业实验室、校企联合攻关等机制,将理 论研究与工业场景深度耦合,实现从论文到产品的快速跨越。 在"AI+"应用 ...
(经济观察)业界人士热议:文旅行业将率先拥抱人工智能
Zhong Guo Xin Wen Wang· 2025-05-08 15:09
中新社上海5月8日电 (记者郑莹莹)上海徐汇区"AI+文旅生态成长计划"8日在模速空间内启动。参与活动 的业界人士认为,对于拥抱人工智能技术,文旅行业更具包容度。 "工业等领域的应用场景需要非常高的准确率,但文旅场景对于这类新科技的包容度是比较高的。比 如,机器人表演有时还会摔跤,对此大家其实是能包容的。"上海魂伴科技有限责任公司(简称:魂伴科 技)合伙人金成思说。他认为,文旅场景有望率先实现人工智能应用落地。 魂伴科技在2025年4月举办的2025上海龙华庙会上展示人形机器人应用。 中新社记者郑莹莹摄 魂伴科技在今年4月举办的2025上海龙华庙会上"秀"了一把机器人,吸引了沪上众多市民游客围观。这 对金成思触动很大:"当时机器人的表演其实并没有往日视频里酷炫,但市民游客仍觉得比在网络视频 里看到的更好、更真实,现场有些老年市民看到现实版人形机器人后,还期待它未来能帮忙养老。" 这让他思考,也许更重要的是让更多市民有机会了解、接触机器人。"我们要让机器人产品从实验室里 走到广场上,了解市民的需求,哪怕让机器人出洋相。如此,我们才能知道我们差的是什么。" 上海稀宇科技有限公司的公共事务副总裁严奕骏也看好文旅领域 ...
国泰海通|电子:从“能动”到“灵动”,机器人智能化步入新篇章
国泰海通证券研究· 2025-05-08 13:18
投资建议。 人形机器人高速发展,具身智能是驱动商业化落地的核心因素。机器人智能水平以及实时控制 性能提升将驱动感知性能、算力、通信效率等需求增长,端侧传感、驱控及通信芯片将充分受益。具身智 能落地打开人形机器人成长空间,未来应用前景广阔,带动整机厂商业绩上行。 报告导读: 具身智能是人形机器人商业化落地核心,多模态、强化学习加速智能进化,感 知传感迭代革新, EtherCAT 赋能高速通信,端侧算力持续升级。 本文摘自:2025年5月8日发布的 从"能动"到"灵动",机器人智能化步入新篇章 舒 迪 ,资格证书编号: S0880521070002 更多国泰海通研究和服务 亦可联系对口销售获取 重要提醒 本订阅号所载内容仅面向国泰海通证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证 券期货投资者适当性管理办法》的要求,若您并非国泰海通证券研究服务签约客户,为保证服务质量、 控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的 不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。 法律声明 市 场空间超万亿,实现具身智能是商业化落 ...
汇纳科技(300609) - 汇纳科技股份有限公司2025年5月8日投资者关系活动记录表
2025-05-08 09:48
答:尊敬的投资者您好,2024 年公司实现营业收入 36,334.74 万元,实现归属于上市 公司股东净利润-2,386.15 万元,较 2023 年减亏 1,016.61 万元,减亏 29.88%,感谢您 对公司的关注。 问题 2:公司之后的盈利有什么增长点? 答:尊敬的投资者,您好,2025 年,公司将牢牢抓住产业发展机会,持续迭代 AI 研 发工作,积极推进业务开拓与企业经营管理,努力实现财务业绩的持续改善。第一, 在商业服务板块,公司将继续推进"汇客云"大数据产品和服务战略,一方面,不断 加大数据样本的采集,扩大数据规模、丰富数据维度、细化数据颗粒度,另一方面不 断挖掘数据价值,持续推出新的数据产品。第二,在公共服务板块,基于现有已成熟 的解决方案,大力拓展相关业务,持续赋能政企客户数字化转型,并积极加强自有产 品体系建设。第三,在算力业务领域,充分利用自有算力资源,开拓算力服务客户, 保持业务良好发展。第四,在大模型与大数据等各类新兴技术应用方面,积极加强研 发工作,做好新兴技术在业务场景的落地应用,持续提升公司核心竞争力。感谢您对 公司的关注。 证券代码:300609 证券简称:汇纳科技 汇纳科技 ...
国泰海通:具身智能驱动人形机器人商业化落地 算法突破等成行业上涨催化剂
智通财经网· 2025-05-08 07:56
国泰海通主要观点如下: 纯视觉方案显著降低硬件成本,实现视觉高效感知,六维力传感器及电子皮肤可有效提高感知灵敏度, 助力机器人精准理解环境信息,精确执行动作操作,纯视觉+六维力传感器+电子皮肤未来有望成为传 感器标准方案。实时控制需要高效的通信协议及强大的硬件算力作为底层支撑,EtherCAT具备高实时 性、低延迟与高同步性,通信延迟由CAN协议的毫秒级降至微秒级,预计将成为机器人主流通信协 议。伴随机器人智能向具身智能演进,端侧算力需求预计持续增长,驱动端侧芯片性能升级。 市场空间超万亿,实现具身智能是商业化落地核心 风险提示:技术迭代速度不及预期,核心环节国产化进度不及预期 智通财经APP获悉,国泰海通发布研报称,具身智能是人形机器人商业化落地核心,多模态、强化学习 加速智能进化,感知传感迭代革新,EtherCAT赋能高速通信,端侧算力持续升级。人形机器人高速发 展,具身智能是驱动商业化落地的核心因素。机器人智能水平以及实时控制性能提升将驱动感知性能、 算力、通信效率等需求增长,端侧传感、驱控及通信芯片将充分受益。具身智能落地打开人形机器人成 长空间,未来应用前景广阔,带动整机厂商业绩上行。高性能多模态大 ...
【行业前瞻】2025-2030年全球及中国多模态大模型行业发展分析
Sou Hu Cai Jing· 2025-05-07 03:45
多模态大模型行业是指围绕能够处理、理解和生成多种类型数据(如文本、图像、音频、视频等)的深度学 习模型所形成的产业生态。这些模型通过融合不同模态的信息,能够执行更复杂和智能的任务,例如视觉 问答、图文生成、语音识别与合成等。 多模态大模型的核心在于跨模态语义对齐,即通过技术手段实现不同模态数据之间的无缝连接和理解。这 种能力使其在多个领域具有广泛的应用潜力,包括但不限于自然语言处理、图像识别、语音识别、智能驾 驶、医疗影像诊断等行业主要上市公司:阿里巴巴(09988.HK,BABA.US);百度(09888.HK,BIDU.US);腾 讯(00700.HK, TCEHY);科大讯飞(002230.SZ);万兴科技(300624.SZ);三六零(601360.SH);昆仑万维(300418.SZ);云从科技 (688327.SH);拓尔思(300229.SZ)等 多模态大模型产业链全景梳理 多模态大模型产业链是一个庞大而复杂的系统,涵盖了从硬件设施到软件开发的各个环节,主要包括基础 层、模型层和应用层。其中,基础层主要包括硬件和基础软件,模型层主要是多模态大模型的种类,包括 CLIP、BLIP、BLIP-2、d ...