OVSeg3R - filings, earnings calls, financial reports, news

OVSeg3R

Search documents

投中网· 2026-01-26 02:12

将投中网设为"星标⭐"，第一时间收获最新推送具身智能中的创新型务实解法。作者丨簪竹来源丨投中网有人说，中国硬科技已站上世界之巅，但就AI大模型的技术水平而言，中国仍处于追赶美国的阶段。这个结论正确吗？我们和昊辰资本创始人汤涛先生就此进行了讨论。他的观点是:至少该结论在"空间智能模型"领域是不正确的。一个来自于粤港澳大湾区数字经济研究院（IDEA研究院）的顶级科学家团队，开发出了全球领先的"空间智能模型"。这个团队的带头人，就是昊辰资本天使轮投资项目视启未来（深圳）科技有限公司（下文简称视启未来）的创始人——张磊博士。图/张磊博士视启未来的由来张磊博士，是中国人工智能奠基人张钹院士的得意门生，也是拥有200余篇顶会论文、Google Scholar引用超6.2万次的IEEE Fellow。 2024 年，张磊博士发布了通用视觉大模型 Grounding DINO 1.5，一举摘得视觉领域 SOTA（当前最优）桂冠。在 COCO、LVIS 等多个国际权威测试中，该模型以绝对优势力压谷歌、Meta、微软等行业巨头，成功在全球舞台上为中国视觉大模型占据顶尖位置，彰显了国产 AI ...

空间智能模型

具身智能

Artificial Intelligence

Artificial Intelligence

Grounding DINO 1.5

DINO-X

OVSeg3R

用2D先验自动生成3D标注，自动驾驶、具身智能有福了丨IDEA团队开源

量子位· 2026-01-17 02:53

IDEA团队投稿量子位 | 公众号 QbitAI 3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本，训练效果有待提升。近年来使用成熟海量的2D实例分割数据来辅助实现3D实例分割成为了一个极具潜力的研究方向，但实现思路不尽相同。近日IDEA计算机视觉与机器人研究中心（CVR，Computer Vision and Robotics）的张磊团队提出了一种名为OVSeg3R的开集3D实例分割学习新范式。与传统训练范式相比， OVSeg3R无需对输入点云进行人工后处理，也不需要高成本的物体3D掩码人工标注，大幅降低了3D实例分割的训练成本，有望让3D实例分割从"只能识别已知类别"的闭集模式，到"可识别未知类别"的开集模式实现商业落地，广泛应用于自动驾驶、智能家居、机器人导航等需要精准3D场景理解的领域。 △ 视频1：从视频到开集空间感知工作流 △ 视频2：OVSeg3R与闭集SoTA模型（SegDINO3D）感知结果对比可视化一、3D感知的"卡脖子"难题 3D实例分割，就是让计算机像人眼一样，看懂三维空间里的每一个物体，以及精准勾勒出每个物体的边界范围。这项技术是自动驾驶、 ...