0.3B,谷歌开源新模型,手机断网也能跑,0.2GB内存就够用
智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔 记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。 EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。 2、专为灵活离线工作而设计:小巧、快速、高效,提供可自定义的输出尺寸,以及2K令牌上下文窗口,可在手机、笔记本电脑、台式机等日常设备上运 行。它旨在与Gemma 3n配合使用,共同为移动RAG管道、语义搜索等解锁新的用例。 3、与流行工具集成:为了让用户轻松开始使用EmbeddingGemma,它已经可以与用户喜欢的工具一起使用,例如sentence-transformers、llama.cpp、 MLX、Ollama、LiteRT、transformers.js、LMStudio、Weaviate、Cloudflare、LlamaIndex、LangChain等。 01.可生成优质嵌入向量,端侧RAG生成答案更准确 Embed ...