杭州“六小龙”开源新模型SpatialLM,登HuggingFace趋势榜第二位
Tai Mei Ti A P P·2025-03-28 03:39
杭州"六小龙"之一的群核科技近日在GTC2025全球大会上低调开源了一款空间理解模型SpatialLM。 SpatialLM是一个基于大语言模型的3D场景语义生成框架。通过一段视频输入,就能准确认知和理解此 视频对应的空间点云数据,并对点云数据进行推理和场景描述,最终将提取的信息以自然语言的形式呈 现。 SpatialLM运行原理 这款中国公司低调开源的模型一经推出,在国外LinkedIn、Twitter和技术圈受到热捧。在最新 HuggingFace趋势榜上,群核科技SpatialLM登上趋势榜第二位,有意思的是趋势榜前三家均是杭州公 司,分别为Deepseek、群核科技SpatialLM、通义千问Qwen2.5-Omni,领先于英伟达、谷歌等公司模 型。 海外平台用户对SpatialLM的自发分享 不同于传统大语言模型,SpatialLM突破了对物理世界几何与空间关系的理解局限,赋予机器类人的空 间认知和解析能力。 目前,SpatialLM已在HuggingFace、GitHub、魔搭社区等平台面向全球开发者开源。 虽然行业已有对图像、视频进行参数化描述模型,比如Meta此前发布的SceneScript模 ...