Qwen 3 0.6B

Search documents
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生
量子位· 2025-08-15 06:44
时令 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌开源Gemma 3 270M闪亮登场! 只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。 此模型小巧又高效,可以直接在浏览器里本地运行,不用联网,也能生成有创意的内容,比如睡前故事。 发布当天,网友也懵了:以为是270B,结果居然才0.27B。 不仅如此,还有人使用这款迷你模型构建了自己的OCR应用程序。上传一张图片或PDF文件,即可用LLM即时将其转换为结构化的 Markdown格式。 值得一提的是,新模型只有 4个注意力头 ,比Qwen 3 0.6B少12个,真是切实符合其轻量化的定位。 下面让我们一起看看这款迷你Gemma 3到底有哪些亮点? Gemma 3 270M核心功能 Gemma 3 270M充分体现了这种" 为工作选择合适工具 " 的理念。 作为一款基础模型,它开箱即可精准遵循指令,而微调能彻底释放其真正实力。 经过专门优化,它在文本分类、数据提取等任务中,都能做到准确、快速且成本可控。 简单总结,新模型的核心功能可概括为以下4部分: 紧凑且高效的架构 这款新模型共包含2.7亿参数,其中1.7 ...