商汤NEO架构
Search documents
商汤发布NEO架构 重新定义多模态模型效能边界
Zheng Quan Ri Bao· 2025-12-02 06:13
当前,业内主流的多模态模型大多遵循"视觉编码器+投影器+语言模型"的模块化范式。这种基于大语 言模型(LLM)的扩展方式,虽然实现了图像输入的兼容,但本质上仍以语言为中心,图像与语言的 融合仅停留在数据层面。这种"拼凑"式的设计不仅学习效率低下,更限制了模型在复杂多模态场景下 (比如涉及图像细节捕捉或复杂空间结构理解)的处理能力。 商汤NEO架构正是为了解决这一痛点而生。早在2024年下半年,商汤便在国内率先突破多模态原生融 合训练技术,以单一模型在SuperCLUE语言评测和OpenCompass多模态评测中夺冠,并基于这一核心技 术打造了日日新SenseNova 6.0,实现多模态推理能力领先。之后,公司在2025年7月份发布日日新 SenseNova 6.5,通过实现编码器层面的早期融合,把多模态模型性价比提升3倍,并在国内率先推出商 用级别的图文交错推理。商汤此次更进一步,彻底摒弃了传统的模块化结构,从底层原理出发,推出了 从零设计的NEO原生架构。 本报讯 (记者李乔宇)近期,商汤集团股份有限公司(以下简称"商汤")正式发布并开源了与南洋理 工大学S-Lab合作研发的全新多模态模型架构——NEO,为 ...