Workflow
瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊
量子位·2025-05-21 04:01

京东探索研究院 投稿 量子位 | 公众号 QbitAI 京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究 提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方 法 。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目 将大模型推理效率平 均提升30%,训练成本降低70% 。 这个名为《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》的 项目,发表在Nature旗下期刊npj Artificial Intelligence上。 据介绍,这是国内首个系统性解决开放环境下大模型开发效率难题并获国际顶刊认证的研究 成果。 提出四个创新方法,推理平均提效30% 以京东大模型为例,蒸馏后的大模型Livebench提升14分。 大量的实验结果也证明有效性和效率, 推理平均提效30%,训练成本平均降低70% 。 根据企业自身业务,将通用模型转化为专业模型 企业将大模型应用付诸实践,面临着诸多卡点: 一方面进入大模型应用门槛高,另一方面模型训练与推理效率低。 京东大模型开发计算技术,能支持企业的模型开发训练及生产,让庞大、重型的AI模型"瘦 ...