Workflow
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA
量子位·2025-05-20 05:12

目前,检索增强技术正从传统的文本场景逐步拓展至涵盖代码与视觉等多模态数据的应用。然而,相较于文本领域,现有向量模型在代码和视 觉模态中的检索效果仍有待提升。 此次智源研究院发布的三款新模型,为构建更强大的多模态检索增强系统提供了有力的支持。 BGE-Code-v1:新一代代码优化语义向量模型 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。BGE自2023 年8月发布以来,已成为中国首个登顶Hugging Face榜首的国产AI模型以及Hugging Face2023年度模型全球下载冠军。 目前, BGE-Code-v1、BGE-VL-v1.5、BGE-VL-Screenshot三款模型已向社区全面开放 ,为相关技术研究与产业应用提供助力。 由智源研究院主导研发的通用向量模型系列BGE,旨在为各类数据提供高效一站式向量表征与语义检索方案,已推出覆盖中英文、多语言检 索及重排模型等多个版本,持续刷新MTEB、C-MTEB、BEIR、MIRACL等主流文本向量评测基准。BGE凭借高性能与开源特性备受业界关 注,已广泛应用于RAG、神经搜 ...