大模型套壳往事
Hu Xiu·2025-07-14 09:26
华为盘古大模型涉嫌套壳阿里云Qwen大模型的风波,再次将模型"原研"与"套壳"的讨论摆上了台面。 回溯三年前,在ChatGPT刚刚开启大模型航海时代时,那时候的套壳还停留在小作坊山寨ChatGPT的阶 段。调用ChatGPT的API,接口再包上一层"中文UI",就能在微信群里按调用次数卖会员。那一年,套 壳成了很多人通往AI财富故事的第一张船票。 同时,开始自主研发大模型的公司里,也不乏对ChatGPT的借力。这些企业虽然有着自研的模型架构, 但在微调阶段或多或少利用了ChatGPT或GPT-4等对话模型生成的数据来做微调。这些合成语料,既保 证了数据的多样性,又是经过OpenAI对齐后的高质量数据。借力ChatGPT可以说是行业内公开的秘密。 从2023年开始,大模型赛道进入开源时代,借助开源框架进行模型训练,成为了很多创业团队的选择。 越来越多的团队公开自己的研究成果,推动技术的交流与迭代,也让套壳开发成为了更普遍的行为。随 意之而的,争议性的套壳事件也逐渐增多,各种涉嫌套壳的事件屡次冲上热搜,随后又被相关方解释澄 清。 国内大模型行业也在"套"与"被套"中,轮番向前发展着。 一、GPT火爆的那一年:山寨 ...