开启端侧长文本时代!面壁全新架构,让小钢炮最快提升220倍
机器之心·2025-06-09 08:03
端侧大模型,正在发生质变。 端侧语言模型,终于迎来了脱胎换骨式的创新。 上周五,2025 智源大会上,国内知名 AI 创业公司面壁智能正式发布了旗下最新一代「小钢炮」模型 MiniCPM 4.0,一下子把 AI 的发展推到了「前进 四」。 机器之心报道 编辑:泽南 模型、预训练数据和端侧推理框架均已开源。 MiniCPM 4.0 系列在卫冕全球最强端侧模型的同时,也让我们看到了继 DeepSeek 之后大模型领域又一次源自底层架构的技术突破。 速度提升百倍 在发布会上,面壁智能 CEO 宣布 MiniCPM 4.0 实现了行业首个系统级上下文稀疏语言模型创新,实现了 5% 的极高稀疏度,能够在端侧跑起长文本推 理,开启了端侧长文本时代。 本次发布的 MiniCPM 4.0 分为 8B 和 0.5B 两个参数版本,均刷新了端侧模型能力的上限。 据介绍,通过架构、算法、数据及系统层面的多维度创新,新一代上下文稀疏高效架构模型 MiniCPM 4.0 8B 相较于 Qwen-3-8B、Llama-3-8B、 GLM-4-9B 等同体量模型实现了长文本推理速度稳定 5 倍, 极限场景下最高 220 倍加速 ,实现了同 ...