Workflow
人工智能训练模式转变
icon
Search documents
现有路径不通?OpenAI、亚马逊考虑改变大模型训练方式
硬AI· 2026-01-25 11:33
AI研究范式或迎来根本转变:专家主张放弃"先预训练后微调"的通用模式,转向在训练早期就为特定目标(如代码、客 服)引入精选数据。若此路径普及,AI开发将从打造"全能模型"转向建多个从零开始的"专用模型",行业生态与团队结构 将因此重塑。 硬·AI 作者 | 叶慧雯 编辑 | 硬 AI 市场已经出现了这种分化的迹象。OpenAI目前正通过路由器将ChatGPT的查询分流至不同模型处理,并 开发了如GPT-5-Codex等专用模型。这种策略反映出消费者对简单聊天机器人的需求,与公司追求超级智 能、科学研究(如火星殖民或疾病治疗)等高端目标之间存在巨大差异。若进一步深化这一路线, OpenAI可能需要彻底重组其研究团队以适应完全不同的模型训练需求。 01 重塑训练逻辑:摒弃通用冗余 目前的AI训练规范在某种程度上模仿了人类的学习过程,即在童年时期积累广泛的基础知识,随后学习特 定技能。然而,行业内部开始反思这一流程的效率。David Luan指出,对于一个旨在处理代码或客户服务 的模型而言,花费大量算力去学习完全不相关的领域(如诗歌或园艺)是一种资源浪费。 这种"广撒网"式的预训练虽然直观,但也导致了诸如"裂脑问题 ...