手机也能跑,腾讯混元一口气开源4款小模型
机器之心报道 机器之心编辑部 刚刚,腾讯混元团队宣布一口气开源了 4 款小模型 —— 最大的只有 7B,另外还包括 4B、1.8B 和 0.5B 三个型号。 这些小语言模型使用「消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。」 目前,这四个模型已在 GitHub 和 HuggingFace 上线。腾讯混元团队表示,ARM、高通、英特尔、联发科技等多个消费级终端芯片平台也都宣布支持部署这些模 型。 GitHub: Hugging Face: 更重要的是,这 4 个开源模型的特点不仅是小,而且还都属于 融合推理模型 ,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思考模式: 腾讯混元表示,这四个模型的亮点在于 agent 和长文能力。跟此前开源的 Hunyuan-A13B 模型一样,技术上通过精心的数据构建和强化学习奖励信号设计,提升了 模型在任务规划、工具调用和复杂决策以及反思等 agent 能力上的表现,让模型实际应用中可以轻松胜任深度搜索、电子表格操作、旅行攻略规划等任务。 此外,模型原生长上下文窗口达到了 256k,意味着模型可以一次 ...