大模型套壳

Search documents
大模型“套壳”争议:自研与借力的边界何在?
Sou Hu Cai Jing· 2025-07-17 01:39
2022年11月,OpenAI基于GPT 3.5推出了ChatGPT,短时间内便吸引了数千万用户,使大型语言模型 (LLM)正式走进公众视野,也将GPT架构推上了主流AI架构的宝座。随着ChatGPT打响大模型时代的 第一枪,各大厂商纷纷涌入这一赛道。由于ChatGPT无法直接接入国内,一些小作坊看到了套壳牟利的 机会,一时间,各种山寨ChatGPT在互联网上泛滥。 这些套壳行为最初往往不涉及任何二次开发,开发者只是简单地对API进行包装并出售。然而,随着监 管的加强,这种低劣的套壳手段很快就被打击。例如,"ChatGPT在线"公众号因涉嫌仿冒ChatGPT被罚 款6万元,成为首例"ChatGPT套壳"行政处罚案例。 尽管如此,套壳行为并未绝迹。在2023年发布的一些模型中,仍时常出现"GPT味"的回复,引发套壳质 疑。例如,讯飞星火大模型曾因涉嫌套壳ChatGPT而引发关注。对此,一些企业解释称,这可能是由于 训练数据中混入了大量ChatGPT生成的内容,导致模型"身份混淆"。另一种可能是,模型研发团队在微 调训练过程中主动使用了通过ChatGPT等OpenAI旗下模型构造的数据集,即所谓的"数据蒸馏"。 ...