Workflow
多模态大模型
icon
Search documents
诚迈科技与联想车计算联合发布座舱AI算力方案Auto AI Box
人民财讯1月6日电,1月6日,诚迈科技(300598)与联想车计算联合发布基于NVIDIA最新车载计算平 台NVIDIA DRIVE AGX Thor的座舱AI算力方案Auto AI Box。该产品融入联想车计算的硬件实力,并搭 载诚迈科技FusionOS4.0——最新的Agentic based AIOS,集成了端侧多模态大模型,支持自然语言交 互,并提供标准化硬件接口,能灵活赋能座舱内丰富的智能体应用场景,并支持高达13B多模态大模型 流畅运行,为下一代智能座舱提供了强大、高效且可扩展的核心计算支持。 ...
海尔消费金融2025年“特征英雄”落下帷幕,数智化风控质效显著
Sou Hu Cai Jing· 2026-01-06 07:50
值得一提的是,公司通过使用多模态大模型,提升了意图识别和风险判定的精度,能精准捕捉"还款困难"等语义特征。另外智能预警模型使早期风险识别效 率提升10%,为信贷业务安全、稳定开展提供了坚实保障。 今年,海尔消金"特征英雄"活动共吸引32名员工踊跃参与,从海量数据里挖掘出了2023个高质量特征!这可不是小数目——相当于给风控系统,添了2023 个"新武器"、"新视角"和"新战场"。 (2025年度特征英雄大赛颁奖仪式,图片来源:海尔消费金融) 本届"特征英雄"大赛一等奖获得者来自风险管理中心,其聚焦创新信息维度,一方面通过采用大模型来替代人工对语音数据做批量处理,提取有效信息用于 信贷模型研发,助力信贷风控策略有效施行,进一步降低信用风险;另一方面充分挖掘信贷场景中时序特征的潜在价值,突破传统"静态快照"局限,利用 RNN、Transformer等序列模型解析用户信息时序数据,精准识别"以贷养贷"行为,阻断风险传导。 近日,海尔消费金融有限公司(以下简称"海尔消金")2025年"特征英雄"活动圆满收官。据海尔消金风控管理中心相关负责人介绍,"特征英雄"活动旨在激 发公司全员坚持数据科学驱动的价值理念,深度挖掘金 ...
简历直推 | 清华大学全国重点实验室招聘工程师/博后/实习生(世界模型/重建/感知等)
自动驾驶之心· 2026-01-06 06:52
自动驾驶车端世界模型方向 招工程师/博后/实习生 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 清华大学智能绿色车辆与交通全国重点实验室招聘工程师/博后/实习生,感兴趣的可以联系柱哥投递简历或邮 箱自行投递简历。 【岗位目标】 面向端到端自动驾驶核心技术需求,从事车端世界模型的研究与工程化落地。构建融合物理先验、时序一致 性与行为预测能力的世界模型架构,实现复杂驾驶场景的理解、预测与生成,支撑自动驾驶系统的感知、预 测、规划一体化能力建设,推动端到端自动驾驶技术的工程化应用。 【核心职责及次要职责】 核心职责: 次要职责: 1. 研究与开发车端世界模型核心架构,融合物理先验、因果推理、时序一致性与行为预测能力; 2. 构建驾驶场景时空表征与预测模型,实现交通参与者行为预测、场景演化推理与长期规划; 3. 研发基于Transformer、Diffusion、Neural Fields等前沿架构的场景生成与仿真模型; 4. 设计多模态输入融合方案,实现图像、点云、地图、轨迹等多源信息的统一编码与推理; 5. 完成世界模型在车端平台的部署优化,满足实时性与资源 ...
行业周报:昆仑芯启动港股IPO,关注MiniMax多模态机会-20260104
KAIYUAN SECURITIES· 2026-01-04 06:06
Investment Rating - The industry investment rating is "Positive" (maintained) [1] Core Insights - The report highlights the ongoing growth in domestic AI chip demand, with Kunlun Core initiating its Hong Kong IPO process, indicating a strong market potential for domestic AI solutions [5][15] - The upcoming listings of major AI model companies, such as MiniMax, are expected to attract significant investment interest, with MiniMax's projected fundraising between 3.83 to 4.19 billion HKD [21][24] - The report emphasizes the accelerating commercialization of Robotaxi services in China, driven by technological advancements, cost reductions, and supportive policies [7][42] Summary by Sections Internet - Kunlun Core has started its Hong Kong listing process, indicating a sustained growth in domestic computing power demand. The report recommends stocks such as Alibaba-W, Baidu Group-SW, and Pinduoduo, with Tencent Holdings identified as a beneficiary [5][14][67] - The Hang Seng Internet Technology Index rose by 4.3% during the week of December 29, 2025, to January 2, 2026, outperforming other indices [14][16] AI - Major AI model stocks, including MiniMax, are set to list soon, with MiniMax's share price range between 151-165 HKD and an expected market capitalization of 46.12 to 50.40 billion HKD. The company has shown significant revenue growth, achieving 53.44 million USD in revenue for the first three quarters of 2025, a 175% year-on-year increase [21][24][24] - MiniMax's diverse revenue model includes subscription services, virtual goods, and online marketing services, indicating a robust business strategy [30][24] Smart Driving - The report notes that the L3 level of autonomous driving in China has received trial approval, marking a significant step towards commercialization. The Robotaxi market is expected to grow rapidly due to technological maturity and policy support [7][42][44] - Various business models for Robotaxi are emerging, including partnerships between manufacturers, autonomous driving companies, and ride-hailing services, which are expected to accelerate commercialization [44][49] Weekly Data Update - The Hang Seng Index increased by 2.01% during the week, with significant gains in the media, automotive, and technology sectors [53][59]
2026年,这个自驾社区计划做这些事情......
自动驾驶之心· 2026-01-02 08:08
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 这两天柱哥也没闲着,琢磨26年星球为大家呈现哪些新内容: 当然,已有的内容我们会争取做的更好: 欢迎大家加入自动驾驶之心知识星球。我们准备了元旦大额新人优惠..... 扛内卷,一个足够有料的社区 对于很多想入门的同学来说,试错成本有点高。没时间和缺乏完整的体系是最大问题,这也容易导致行业壁垒 越来越高,如果想要卷赢那就更加困难了。 所以我们联合了诸多学术界和工业界的大佬,共同打造了我们维护三年之久的『自动驾驶之心知识星球』! 星球目前集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的自驾社区,已经超过4000人 星友面对面:目前已经开展了五期,很多星友跟柱哥反馈都不错,今年我们会持续做下去,学术界和工业 界,科研就业和申博,跳槽和转行,前沿技术和下沉领域,争取全面覆盖大家的需求; 专家访谈:25下半年我们陆续接触到一些企业的中高层,计划今年会开展一些技术类的访谈,把行业不同 层级公司关心的内容呈现给大家; 行业调研:智驾的规模化量产,大概率是26年的主线,但与此同时L4赛道也重回大众 ...
重新定义视频大模型时序定位!南大腾讯联合提出TimeLens,数据+算法全方位升级
机器之心· 2026-01-02 01:55
长期以来,大量研究致力于设计复杂的模型结构,却忽视了两个关键问题: 在数据层面,我们依赖 的评测基 准是否可靠?在算法层面,是否存在一套简洁通用的 最佳实践? 针对上述痛点,来自南京大学、腾讯 ARC Lab 和上海 AI Lab 的联合研究团队提出了 TimeLens (时间透镜),系统性地揭示了现有数据的"评测陷阱",构建出更 可靠的评测基准和高质量训练数据,并探索出一套简洁有效的算法优化。得益于这些贡献,仅 8B 参数的 TimeLens 模型成为了开源模型中的新 SOTA ,更击败了 GPT-5 和 Gemini-2.5-Flash 等闭源巨头。 随着多模态大模型(MLLMs)的飞速发展,模型已经能够很好地理解视频中 "发生了什么(What)",却无法精准地定位到事件在视频中 "何时发生(When)"。 这种视频时序定位(Video Temporal Grounding, VTG)能力的严重缺陷,已成为制约 MLLM 迈向更精细化的视频理解的主要瓶颈。 核心洞察:拨开数据质量的迷雾 在深度学习中,"Data is fuel"(数据即燃料)是公认的真理。然而,团队发现,在 VTG 领域,燃料的质量却令人 ...
商汤Kapi相机跃居中国区App Store「摄影与录像」榜首,此前在海外多国热度领先
Xin Lang Cai Jing· 2025-12-31 16:01
Core Insights - SenseTime's Kapi camera has topped the Apple App Store's "Photography & Video" category in China as of December 31, showcasing its strong market performance and innovative features [2][7] - The Kapi camera, launched on December 20, is positioned as the first true "AI photography assistant," breaking traditional app limitations and offering advanced features like scene recognition and filter recommendations [2][3][8] - The success of Kapi camera indicates a significant shift in consumer-level AI applications, moving from experimental technology to mainstream usage, thus enhancing confidence in AI commercialization [5][10] Product Performance - Kapi camera achieved the number one spot in the Philippines App Store free app category on December 8 and has maintained a strong presence in the "Photos & Videos" category across multiple countries, including the UK, Italy, France, and Germany [3][8] - The app's technology includes a professional image processing workflow that replicates the Apple Log curve, allowing users to capture images with cinematic quality and rich detail without post-processing [3][8] Technological Advancements - SenseTime's SenseNova V6.5 Pro ranked first in the domestic evaluation by SuperCLUE, scoring 75.35 and achieving the highest score in visual reasoning among domestic models [4][9] - The report highlights that SenseTime's models are approaching the average level of leading models in basic cognitive dimensions, with SenseNova V6.5 exceeding the average in visual reasoning, indicating a competitive edge in the industry [9][10]
星源智与征和工业达成战略合作,聚焦七大方向构建全方位协同创新体系
IPO早知道· 2025-12-31 05:26
实现"硬件+软件"优势互补。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,青岛征和工业股份有限公司(以下简称"征和工业" )日前与北京星源智机器人科 技有限公司(以下简称"星源智")正式签署战略合作协议。 双方将依托各自在智能硬件研发制造与多模态大模型领域的核心优势,开展深度协同合作,共同推动 智能灵巧手与具身智能技术的融合创新,为人形机器人、协作机器人等领域提供更具竞争力的末端执 行解决方案,助力智能机器人产业高质量发展。当前,人形机器人产业正从技术验证期向规模化商用 期快速过渡,核心零部件国产化进程加速,市场规模持续扩大。作为机器人末端执行核心部件的智能 灵巧手,其感知、决策与自适应能力是决定机器人作业效能的关键,而多模态大模型技术的融入则为 提升灵巧手智能化水平提供了核心支撑。双方的战略合作,正是顺应产业发展趋势,实现"硬件+软 件"优势互补的重要举措。 根据协议,双方的合作将聚焦七大核心方向,构建全方位协同创新体系: 1、双方建立战略合作和联合开发,致力于让灵巧手拥有自主感知、规划决策和自适应能力,为人形 机器人、协作机器人、机械臂等提 ...
智赋未来,链动生态 |征和工业 x 星源智达成战略合作
Xin Lang Cai Jing· 2025-12-31 01:44
近日,青岛征和工业股份有限公司(以下简称"征和工业"、"公司"、003033.SZ)与北京星源智机器人 科技有限公司(以下简称"星源智")正式签署战略合作协议。双方将依托各自在智能硬件研发制造与多 模态大模型领域的核心优势,开展深度协同合作,共同推动智能灵巧手与具身智能技术的融合创新,为 人形机器人、协作机器人等领域提供更具竞争力的末端执行解决方案,助力智能机器人产业高质量发 展。当前,人形机器人产业正从技术验证期向规模化商用期快速过渡,核心零部件国产化进程加速,市 场规模持续扩大。作为机器人末端执行核心部件的智能灵巧手,其感知、决策与自适应能力是决定机器 人作业效能的关键,而多模态大模型技术的融入则为提升灵巧手智能化水平提供了核心支撑。此次公司 与星源智的战略合作,正是顺应产业发展趋势,实现"硬件+软件"优势互补的重要举措。 根据协议,双方的合作将聚焦七大核心方向,构建全方位协同创新体系: l 公司聚焦智能灵巧手硬件与控制系统的研发与制造,星源智聚焦多模态大模型(包括灵巧手操作大模 型)。双方建立战略合作和联合开发,致力于让灵巧手拥有自主感知、规划决策和自适应能力,为人形 机器人、协作机器人、机械臂等提供系 ...
三维空间太难懂?RoboTracer让机器人理解复杂空间指令,推理3D空间轨迹,开放世界也能精确行动
机器之心· 2025-12-30 12:10
本文的主要作者来自北京航空航天大学、北京大学、北京智源人工智能研究院和中科院自动化研究所。本 文的第一作者为北京航空航天大学博士生周恩申,主要研究方向为具身智能和多模态大模型。本文的共一 作者兼项目负责人为北京智源研究院研究员迟程。本文的通讯作者为北京航空航天大学教授盛律和北京大 学计算机学院研究员、助理教授仉尚航。 我们希望具身机器人真正走进真实世界,尤其走进每个人的家里,帮我们完成浇花、收纳、清洁等日常任 务。但家庭环境不像实验室那样干净、单一、可控:物体种类多、摆放杂、随时会变化,这让机器人在三 维物理世界中「看懂并做好」变得更难。 想象一下你下班回到家,对家用服务机器人说: 「按从左到右的顺序给每盆花浇水;喷壶要在每朵花上方 1–5 厘米处停住再浇,这样更均匀。」(如下图) 对人来说这很自然,但对机器人来说,难点不在「浇水」本身,而在指令里隐含了大量空间约束:既有 定 性 的(从左到右、在上方),也有 定量 的(1–5 厘米)。在杂乱的开放世界场景中,让机器人稳定遵循这 些约束,哪怕对目前最先进的视觉 - 语言 - 动作模型(VLA)也依然是挑战。 一个直接的突破口是:让视觉 - 语言模型(VLM)生 ...