多模态

Search documents
计算机行业周报(20250616-20250620):AIASMR现象级表现,多模态加速进入市场-20250622
Huachuang Securities· 2025-06-22 15:21
证 券 研 究 报 告 计算机行业周报(20250616-20250620) 相对指数表现 | % | 1M | 6M | 12M | | --- | --- | --- | --- | | 绝对表现 | 0.4% | 88.3% | 40.4% | | 相对表现 | -1.3% | 61.5% | 28.0% | AI ASMR 现象级表现,多模态加速进入市场 行业研究 计算机 2025 年 6 月 22 日 政策 推荐(维持) 华创证券研究所 证券分析师:吴鸣远 邮箱:wumingyuan@hcyjs.com 执业编号:S0360523040001 行业基本数据 | | | 占比% | | --- | --- | --- | | 股票家数(只) | 336 | 0.04 | | 总市值(亿元) | 50,036.49 | 4.91 | | 流通市值(亿元) | 42,548.09 | 5.23 | -28% -4% 20% 44% 24/03 24/06 24/08 24/10 25/01 25/03 2024-03-25~2025-03-21 计算机 沪深300 相关研究报告 《海外科技行业重大事项点评 ...
深入浅出完整解析LoRA(Low-Rank Adaptation)模型核心基础知识
自动驾驶之心· 2025-06-22 14:09
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型高效微调已经成为业界关注的焦点,无论是通用大模型,还是智驾大模型,如何通过轻量微调变成各个不同领域的专业模型,成为 讨论的热点。所以今天就来大家一起聊聊LORA。 背景: 业内的大公司或者研究机构,都是有足够资源的来开发大模型,但是对于一般的小公司或者个人来说,要想开发自己的大模型几乎 不可能,要知道像 ChatGPT 这样的大模型,一次训练的成本就在上千万美元,而即使是DeepSeekv3,单次训练成本也在500万美元以上, 所以充分利用开源大模型,在领域任务上高效微调便成为了当下学术界和工业界迫切需要解决的问题,至此LoRA问世: LoRA 的思想很简单: 而这个降维的操作就需要用到低秩分解了,接下来我们回顾下低秩分解: * [16] A. A. K. 那么LoRA训练的思路和优势是什么呢? 在原始 PLM (Pre-trained Language Model) 旁边增加一个旁路,做一个降维再升维的操作,来模拟所谓的intrinsic rank。 训练的时候固定 PLM 的参数,只训练降维矩阵 A ...
开源版MetaQuery来了!OpenUni用1.1B参数媲美BLIP3-o-8B,数据代码完全开源
机器之心· 2025-06-22 04:26
随着 GPT-4o 展现出令人印象深刻的多模态能力,将视觉理解和图像生成统一到单一模型中已成为 AI 领域的研究趋势(如MetaQuery 和 BLIP3-o )。 南洋理工大学 S-Lab 和商汤科技的研究团队推出 OpenUni,一个开源版 MetaQuery,仅用 1.1B 参数达到 8B 模型性能,更将代码、权重、数据全部开源! https://github.com/wusize/OpenUni 联系方式: size001@e.ntu.edu.sg 架构图, OpenUni 架构:通过 256 个可学习查询和 6 层轻量连接器,桥接冻结的 InternVL (理解)与 SANA (生成) 机构: 南洋理工大学 S-Lab、商汤科技新加坡研究院 作者: Size Wu*, Zhonghua Wu*, Zerui Gong* (* 同等贡献), Qingyi Tao, Sheng Jin, Qinyue Li, Wei Li, Chen Change Loy 开源代码: 图 1 : OpenUni 在生成任务上的性能表现,展示了其高效的参数利用 三大核心优势 | Size Wu*1 | | Zhonghu ...
广联达(002410) - 002410广联达投资者关系管理信息20250621
2025-06-21 13:35
证券代码:002410 证券简称:广联达 广联达科技股份有限公司投资者关系活动记录表 编号:2025-005 投资者关系活动 类别 √特定对象调研 □分析师会议 □媒体采访 □业绩说明会 □新闻发布会 □路演活动 □现场参观 □其他 (请文字说明其他活动内容) 活动参与人员 嘉实基金、泰康资产、天弘基金、中信资管、华商基金、高信百 诺、华夏久盈、博时基金、华安基金、财通资管、万家基金、中 信证券 时间 2025 年 6 月 19 日/6 月 20 日 地点 广联达信息大厦/广联达上海大厦 形式 现场 上市公司接待人 员姓名 董事会秘书冯健雄 行业 AI 部总经理李 江 交流内容及具体 问答记录 一、AI 情况介绍 由公司行业 AI 部总经理李江对广联达 AI 战略及场景落地做 综合介绍 二、互动问答 Q1:公司今年提出产业 AI,那做好产业 AI 需要具备哪些要 素以及公司具备的优势 答:从产业 AI 的定义来看,是指将人工智能技术与特定产业 的领域知识、业务流程、数据特性深度融合,以解决产业实际问 题、提升生产效率、优化资源配置、创造新价值的技术体系和应 用范式。做好产业 AI 有三个成功关键要素,一是高质 ...
英国研发新型机器人皮肤
Xin Hua Wang· 2025-06-21 07:37
Core Insights - Researchers from Cambridge University and University College London have developed a new type of robotic skin made from soft and low-cost gel materials that can sense pressure and temperature, and distinguish multiple contact points, enabling robots to gather environmental information similarly to humans [1][2] Group 1: Technology Development - The flexible conductive skin is easy to manufacture and can be melted and reshaped into various complex forms, allowing for meaningful interaction with the physical world [1] - The solution employs a single sensor that responds differently to various tactile stimuli, known as multimodal perception, which, despite challenges in isolating signal sources, is easier to manufacture and more durable [1] Group 2: Testing and Applications - Various tactile tests were conducted, including heating with a heat gun, pressing with human fingers and robotic arms, light touches, and even cutting with a scalpel, with data collected used to train a machine learning model for recognizing different tactile meanings [2] - Although the robotic skin's sensitivity does not yet match that of human skin, it surpasses existing technologies in flexibility and ease of manufacturing, allowing for human tactile calibration for various tasks [2] - Future applications of this robotic skin include humanoid robots, prosthetics requiring tactile sensing, and potential uses in industries such as automotive manufacturing and disaster relief [2]
展位有限!第二届全球医疗科技大会招商进行中
思宇MedTech· 2025-06-20 11:17
思宇年度活动回顾: 首届全球眼科大会 | 首届全球骨科大会 | 首届全球心血管大会 | 首届全球医美科技大会 由思宇MedTech主办的 第二届全球医疗科技大会 , 将于2025年7月17日在北京中关村展示中心举行。作 为专注于医疗器械的高规格行业大会,企业参展不仅是一次线下交流,更是一次精准的品牌曝光机会。 大会 聚焦"前沿技术 · 从研发走向临床应用" 。目前, 招商已经开始, 展位有限,欢迎有意企业抓紧对接。 权益包括但不限于: 商务合作,联系方式如下。 工作微信号: suribot22 手机号: 13552754250 # 大会概况 一、会议地点 : 中关村展示中心会议中心(北京市海淀区新建宫门路2号) 六、大会议程(拟) 本次大会将邀请来自影像设备、AI平台、高值耗材、能量系统、材料技术等方向的上市公司、创业企业等,分 享 产品创新、技术落地、医工协同等方面的实践经验。 本届大会将重点探讨以下话题: AI与智能系统 也可以直接联系主编赵清、Alice、Jacky、Ziana 等任何思宇团队的工作人员。 以下为思宇此前举办的大会展位示意图,供参考: 主题演讲 大会现场品牌展位 企业宣传资料发放 活动现 ...
特斯联邵岭:以多模态统一空间模型打造空间智能
Zhong Guo Ji Jin Bao· 2025-06-20 08:05
Core Insights - The article discusses the transformative potential of spatial intelligence in AI, emphasizing its ability to interact with the three-dimensional world through perception, navigation, operation, reasoning, and environment generation [4][6][8] - The integration of various algorithms and technologies, such as computer vision, deep learning, and multimodal learning, is crucial for the development of spatial intelligence [6][7] Group 1: Spatial Intelligence Development - Spatial intelligence is defined as the capability of AI to interact with the three-dimensional world, relying on multiple forms of algorithms and technologies [4][6] - The development of spatial intelligence involves challenges such as integrating diverse data types and executing complex tasks [2][4] - The company is focusing on creating a multimodal fusion spatial intelligence model that aligns with user scenarios, utilizing pre-trained large models and reinforcement learning techniques [6][7] Group 2: Technological Foundations - Key technologies for spatial intelligence include computer vision, deep learning, 3D representation learning, and visual-language models [6][7] - The company has extensive experience in various technical fields, which has been applied to multiple projects and solutions [6][7] - The ability to process and analyze diverse data types, including text, images, sounds, and environmental data, enhances the robustness and generalization of spatial intelligence models [7][8] Group 3: Future Plans and Market Strategy - The company aims to develop specialized AI agents for mobile terminals and smart environments, enhancing the value and competitiveness of Chinese products in overseas markets [7][8] - Short-term goals include creating AI agents with human-like thinking and long-term memory capabilities for wearable devices and robots [8] - Long-term objectives involve evolving from specialized AI agents to general intelligence agents, exploring advanced spatial intelligence and autonomous learning technologies [8]
特斯联邵岭:以多模态统一空间模型打造空间智能
中国基金报· 2025-06-20 07:55
当前,大模型技术正通过架构革新与多模态融合,重构空间智能发展的底层逻辑,推动其从 实验室走向产业化应用。传统的人工智能方法关注处理结构化数据和遵循预定义的规则。然 而,空间智能的出现就是为了处理物理世界因多样性、复杂性导致的更为细致的空间推理。 通过空间智能,机器可以用类人的方式与周边环境进行3D立体互动,并进行解读;无可争议 的是深度学习模型已在各种计算机视觉任务中有了很多出众的表现,但其面临的挑战,例 如,怎样集成多种数据类型并同时执行复杂任务就显得尤为突出。 我们与 特斯联国际总裁、特斯联首席科学家、AI Lab负责人邵岭博士 ,就空间智能及衍生话 题,诸如多模态数据融合等进行了 探讨 。 邵岭博士在人工智能领域有着数十年的前沿探索经验。 他 表示, 空间智能是人工智能和三 维世界交互的能力,它通过感知、导航、操作、推理和环境生成等多种形式展现,并依赖于 计算机视觉、深度学习、三维表示学习、多模态学习等多种算法和技术来实现,而特斯联正 在将 所有的模态数据统一到同一个语义空间,结合大模型的预训练和强化学习技术, 研发 与用户场景对齐的多模态融合空间智能大模型,并打造 类人思考、长期记忆、个性化 的AI智 ...
明略科技发布全球化广告测试及优化产品AdEff
Zheng Quan Ri Bao Wang· 2025-06-20 07:18
Core Insights - Minglue Technology officially launched AdEff, an AI-driven global advertising testing and optimization product, on June 19 [1] - AdEff is developed based on Minglue's proprietary Hypergraph Multimodal Large Language Model (HMLLM) and employs a collaborative architecture of large models and mixed expert models [1] - The product aims to address long-standing challenges in advertising testing and optimization regarding time and cost, providing a new efficiency tool for the creative industry [1] Group 1 - AdEff can simulate consumer feedback on advertising creativity in just a few minutes and provide targeted optimization suggestions [1] - The product enables marketing and creative professionals to make more agile and informed decisions based on data, enhancing the success rate of advertising campaigns [1] - AdEff significantly reduces the cost of advertising testing, allowing companies to test every advertisement and find a balance between "creative sensibility" and "commercial rationality" [1] Group 2 - AdEff represents the latest application of generative AI technology and intelligent agents in the marketing services sector, indicating the future direction of marketing tool development [2] - The company plans to continue enhancing AdEff in areas such as brand content measurement types, technical optimization, personalized adaptation, and global ecosystem expansion [2]
Agent开始“卷”执行力,云厂商的钱包准备好了吗?
第一财经· 2025-06-20 03:32
2025.06. 20 本文字数:2076,阅读时长大约4分钟 作者 | 第一财经 吕倩 本周又是Agent(智能体)热度持续的一周。北京时间6月19日,国内大模型初创企业Minimax发布能够 完成长程(Long Horizon)复杂任务的通用智能体MiniMax Agent,多步规划专家级解决方案、拆解任 务需求、执行多个子任务从而交付最终结果。 大模型干活更强了 在山姆·奥尔特曼的表述中,新模式的显著特性已不是性能多么好,而是干活多么强。 即将发布的GPT-5将不再是一个单一功能的产品,而是一个经过架构融合的综合性产物,该变化折射的 是山姆对AGI(通用人工智能)定义理解的变动,他表示,现在AI的发展已远远超过五年前行业根据软件 认知能力而提出的AGI定义。当下更需要考虑的是,AGI需要什么?山姆认为是能够自主发现新科学或极 大提高人们使用工具发现新科学的能力,例如当下正火的AI编程产品。 一位二级市场券商分析师对记者表示,大模型真正产生价值始于Agent开始为人类工作,虽然行业还处于 非常早期的阶段。过去的AI也具备提效功能,但存在功能单一且依赖人类指导、缺乏通用性和自主性等问 题。Agent将自然语 ...