Workflow
自研与自主创新
icon
Search documents
华为盘古大模型事件的“三重门”
Jing Ji Guan Cha Wang· 2025-07-09 22:55
经济观察报 记者 周悦 7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种"模型指纹"技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。 经济观察报检索该报告引用的文献内容,发现部分文献无法在公开数据库中查验。截至发稿前,该报告已经在Github删除,HonestAGI主页无法找到。 此外,原报告发布在GitHub页面,但点赞(stars)、收藏(forks)等数据数较低;相比之下,其他具备社区共识的模型安全/评估工具如OpenLlama Eval等, 往往在发布几小时内即获得数百互动。作为对比,OpenLlama Eval点赞目前超过7500,收藏超过400。 该报告作者认为,盘古模型可能在千问模型的基础上进行了增量训练,而非完全从零训练。 事涉华为和阿里,这一报告引发关注。支持者认为,两个模型在众多注意力参数上呈现近乎一致的分布,自然发生(非人为干预)的可能性较低。质疑者则 指出,这一方法过于简化,来自Github、知 ...