Workflow
OpenAI 推出两款开源模型,GPT-5蓄势待发!
Jing Ji Guan Cha Bao·2025-08-06 06:36

8月6日消息,OpenAI宣布推出两款开源模型GPT-oss-120b和GPT-oss-20b,这是自2020年发布GPT-2以 来,OpenAI首次推出开源语言模型。这两款模型均可在Hugging Face在线开发者平台上免费下载, OpenAI称其在多个用于比较开源模型的基准测试中表现"处于前沿水平"。 两款开源模型亮相,性能与兼容性兼具 据每日经济新闻援引OpenAI介绍,两款gpt-oss模型采用了其最先进的预训练和后训练技术,特别注重 推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的Transformer,以减少处理输 入所需的活跃参数数量。 gpt-oss-120b每个token激活5.1亿参数,总参数量为1170亿;gpt-oss-20b激活3.6B参数,总参数量为210 亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达128k的上下文长度。OpenAI称gpt-oss- 20b是一款中型开放模型,gpt-oss-120b则是可在"大多数台式机和笔记本电脑"上运行的大型开放模型。 OpenAI表示,较小的模型至少需要16GB显存或统一内存才能发挥最佳性能,并且"非常适 ...