Gemma 3 270M

Search documents
腾讯研究院AI速递 20250818
腾讯研究院· 2025-08-17 16:01
生成式AI 一、 谷歌开源Gemma 3 270M,4个注意力头专为终端而生 1. 谷歌发布轻量级模型Gemma 3 270M,下载仅241MB,拥有2.7亿参数,其中嵌入参数1.7亿个,Transformer模 块1亿个; 2. 模型极致节能,在Pixel 9 Pro手机上25次对话仅消耗0.75%电量,INT4量化后可在资源受限设备上高效运行; 3. 在IFEval基准测试上超越Qwen 2.5同级模型,支持高效指令遵循,下载量已突破两亿次,专为特定任务微调设 计。 https://mp.weixin.qq.com/s/IH64apP7SmHVCwHKfTGOsQ 二、 Meta 正式开源了 DINOv3,通用SOTA 级视觉基础模型 1. Meta开源DINOv3视觉基础模型,采用自监督学习,首次全面超越弱监督模型,在多个密集预测任务中表现优于专 业解决方案; 2. 模型采用创新的Gram Anchoring策略和旋转位置编码(RoPE),参数规模扩展至70亿,训练数据扩展至17亿张图 像; 3. DINOv3商业许可开源,提供多种规模模型系列(含ViT-B、ViT-L等),并专门训练了卫星图像骨干网络 ...
腾讯混元开源游戏AI生成新工具,昆仑万维推出Matrix-3D
GOLDEN SUN SECURITIES· 2025-08-17 07:00
证券研究报告 | 行业周报 gszqdatemark 2025 08 17 年 月 日 【谷歌开源 Gemma 3 270M,性能超越 Qwen 2.5 同级模型】谷歌开源 Gemma 3 270M 模型,这款仅含 2.7 亿参数的轻量化 AI 引发关注。该模型采 用紧凑高效架构,其中 1.7 亿为嵌入层参数,另外 1 亿为 Transformer 模块参 数,凭借 25.6 万 token 的庞大词汇量,能够处理特定及罕见词汇。该模型还 具有极致的能源效率,在 Pixel 9 Pro 手机上运行 INT4 量化版时,25 轮对话 仅耗电 0.75%。同时它还具有开箱即用的精准指令遵循能力,支持 INT4 精度 运行且性能损失极低。实际应用场景广泛,该模型特别适合在批量处理专业 任务、严格控制响应时间和成本、快速迭代和部署、确保用户隐私和多任务 专业部署时使用。 风险提示:政策监管风险,竞争加剧风险,宏观环境不确定性风险。 增持(维持) 行业走势 -10% 6% 22% 38% 54% 70% 2024-08 2024-12 2025-04 2025-08 传媒 沪深300 作者 分析师 顾晟 执业证书编号: ...
X @Demis Hassabis
Demis Hassabis· 2025-08-15 23:45
New hyper-efficient addition to our amazing Gemma open models: Gemma 3 270M packs a real punch for its tiny size! It’s super compact and power efficient, so you can easily run your own task-specific fine-tuned systems on edge devices. Enjoy building with it!Google AI Developers (@googleaidevs):Introducing Gemma 3 270M! 🚀 It sets a new standard for instruction-following in compact models, while being extremely efficient for specialized tasks. https://t.co/kC9OOPwzVi ...
X @Demis Hassabis
Demis Hassabis· 2025-08-15 17:27
RT Google AI (@GoogleAI)Here’s what we shipped this week 🚢🚢🚢—We launched a new Imagen 4 Fast model so developers can quickly generate images at only $0.02 per image and updated Imagen 4 and Imagen 4 Ultra to support 2K images. All are now generally available in the Gemini API for developers and @GoogleCloud Vertex AI for enterprise customers.—We introduced Gemma 3 270M, a new model in our Gemma family that’s hyper-efficient and best for developers to take and fine-tune for specific tasks.—Google AI Ultra su ...
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生
量子位· 2025-08-15 06:44
时令 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌开源Gemma 3 270M闪亮登场! 只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。 此模型小巧又高效,可以直接在浏览器里本地运行,不用联网,也能生成有创意的内容,比如睡前故事。 发布当天,网友也懵了:以为是270B,结果居然才0.27B。 不仅如此,还有人使用这款迷你模型构建了自己的OCR应用程序。上传一张图片或PDF文件,即可用LLM即时将其转换为结构化的 Markdown格式。 值得一提的是,新模型只有 4个注意力头 ,比Qwen 3 0.6B少12个,真是切实符合其轻量化的定位。 下面让我们一起看看这款迷你Gemma 3到底有哪些亮点? Gemma 3 270M核心功能 Gemma 3 270M充分体现了这种" 为工作选择合适工具 " 的理念。 作为一款基础模型,它开箱即可精准遵循指令,而微调能彻底释放其真正实力。 经过专门优化,它在文本分类、数据提取等任务中,都能做到准确、快速且成本可控。 简单总结,新模型的核心功能可概括为以下4部分: 紧凑且高效的架构 这款新模型共包含2.7亿参数,其中1.7 ...
谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
机器之心· 2025-08-15 04:17
机器之心报道 机器之心编辑部 下载下来只有 241 MB。 本周四,谷歌正式发布了 Gemma 3 的最新一款模型。 Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。 它继承了 Gemma 3 系列的先进架构和强大的预训练功能,同时为小尺寸模型带来了强大的指令执行能力。谷歌展示的 IFEval 基准测试成绩所示,在同级模型上, Gemma 3 270M 树立了新的性能水平,使复杂的 AI 功能更容易应用于设备端和研究应用。 IFEval 旨在测试模型执行可验证指令的能力。 Gemma 3 270M 的核心功能主要包括如下几个方面: 对于 1.7 亿个嵌入参数,如何在训练过程中保证不出现嵌入崩溃,谷歌并没有对技术细节进行太多解释。不过在谷歌发布后,AI 社区很快开始了研究。 紧凑而强大的架构:新模型共有 2.7 亿参数:由于词汇量庞大,嵌入参数有 1.7 亿个,Transformer 模块则有 1 亿个。得益于 256k 个 token 的庞大词汇量,该 模型可以处理特定和罕见的 token,使其成为强大的基础模型,可 ...
X @Demis Hassabis
Demis Hassabis· 2025-08-14 18:27
RT Google AI Developers (@googleaidevs)Introducing Gemma 3 270M! 🚀 It sets a new standard for instruction-following in compact models, while being extremely efficient for specialized tasks. https://t.co/kC9OOPwzVi ...
X @Demis Hassabis
Demis Hassabis· 2025-08-14 18:14
RT Omar Sanseviero (@osanseviero)Introducing Gemma 3 270M 🔥🤏A tiny model! Just 270 million parameters🧠 Very strong instruction following🤖 Fine-tune in just a few minutes, with a large vocabulary to serve as a high-quality foundationhttps://t.co/E0BB5nlI1k https://t.co/XntprMBqSC ...