腾讯,最新发布!
"这四个模型的亮点在于Agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,技术上 通过数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及 反思等Agent能力上的表现,让模型实际应用中可以胜任深度搜索、Excel操作、旅行攻略规 划等 任务。"一位知情人介绍称。 值得一提的是,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当 于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利·波特》小说,并 且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。 【导读】最小仅0.5B,腾讯混元推出4款开源模型 中国基金报记者 张燕北 持续开源。 8月4日,腾讯混元宣布开源四款小尺寸模型,其中最小仅0.5B。据了解, 这四个模型的亮点 在于Agent和长文能力,能够满足从端侧到云端、从通用到专业的多样化需求,"手机也能 跑"。今年以来,开源成为全球大模型领域的重要主题,中国大模型表现尤为亮眼。 腾讯混元推出多款小尺寸开源模型 腾讯混元此次宣布开源的四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡 即可运行,适用 ...