OVSeg3R
Search documents
视启未来——两大AI领军人物看中的"空间智能模型"公司
投中网· 2026-01-26 02:12
将投中网设为"星标⭐",第一时间收获最新推送 具身智能中的创新型务实解法。 作者丨 簪竹 来源丨 投中网 有人说,中国硬科技已站上世界之巅,但就AI大模型的技术水平而言,中国仍处于追赶美国的阶段。这个结论正确吗?我们和 昊辰资本创始人汤涛 先 生就此进行了讨论。他的观点是:至少该结论在"空间智能模型"领域是不正确的。一个来自于粤港澳大湾区数字经济研究院(IDEA研究院)的顶级科学 家团队,开发出了全球领先的"空间智能模型"。这个团队的带头人,就是昊辰资本天使轮投资项目 视启未来(深圳)科技有限公司 (下文简称视启未 来)的创始人——张磊博士。 图/张磊博士 视启未来的由来 张磊博士,是中国人工智能奠基人张钹院士的得意门生,也是拥有200余篇顶会论文、Google Scholar引用超6.2万次的IEEE Fellow。 2024 年,张 磊博士发布了通用视觉大模型 Grounding DINO 1.5,一举摘得视觉领域 SOTA(当前最优) 桂冠。在 COCO、LVIS 等多个国际权威测试中,该模 型以绝对优势力压谷歌、Meta、微软等行业巨头,成功在全球舞台上为中国视觉大模型占据顶尖位置,彰显了国产 AI ...
用2D先验自动生成3D标注,自动驾驶、具身智能有福了丨IDEA团队开源
量子位· 2026-01-17 02:53
IDEA团队 投稿 量子位 | 公众号 QbitAI 3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本,训练效果有待提升。 近年来使用成熟海量的2D实例分割数据来辅助实现3D实例分割成为了一个极具潜力的研究方向,但实现思路不尽相同。 近日IDEA计算机视觉与机器人研究中心 (CVR,Computer Vision and Robotics) 的张磊团队提出了一种名为OVSeg3R的开集3D实例分 割学习新范式。 与传统训练范式相比, OVSeg3R无需对输入点云进行人工后处理 ,也不需要高成本的物体3D掩码人工标注,大幅降低了3D实例分割的训练 成本,有望让3D实例分割从"只能识别已知类别"的闭集模式,到"可识别未知类别"的开集模式实现商业落地,广泛应用于 自动驾驶、智能家 居、机器人导航等需要精准3D场景理解的领域 。 △ 视频1:从视频到开集空间感知工作流 △ 视频2:OVSeg3R与闭集SoTA模型 (SegDINO3D) 感知结果对比可视化 一、3D感知的"卡脖子"难题 3D实例分割,就是让计算机像人眼一样,看懂三维空间里的每一个物体,以及精准勾勒出每个物体的边界范围。 这项技术是自动驾驶、 ...