华为盘古

Search documents
华为盘古之殇!大模型员工自曝文引爆全网,收获 10500+ Star
程序员的那些事· 2025-07-10 15:48
https://github.com/HW-whistleblower/True-Story-of-Pangu 截至 2025-07-10 为止,作者「HW吹哨人」已追更补充 4 次,该文已收过 10500+ Star。347 个 issues,也是相当热闹。 推荐阅读 点击标题可跳转 1、 腾讯:鸿蒙架构特殊,微信适配必须从零重写代码 2、 华为盘古团队:否认抄袭! 3、 B 站游戏高管"小姐姐"被逮捕 7 月 5 日, 华为盘古技术团队公开发声明,否认了最近的抄袭传闻 。 7 月 6 日,一篇自称盘古团队内部员工写的文档,在网上引发热议。 该文也发在 GitHub 上了。 - EOF - ...
华为盘古大模型事件的“三重门”
Jing Ji Guan Cha Wang· 2025-07-09 22:55
经济观察报 记者 周悦 7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种"模型指纹"技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。 经济观察报检索该报告引用的文献内容,发现部分文献无法在公开数据库中查验。截至发稿前,该报告已经在Github删除,HonestAGI主页无法找到。 此外,原报告发布在GitHub页面,但点赞(stars)、收藏(forks)等数据数较低;相比之下,其他具备社区共识的模型安全/评估工具如OpenLlama Eval等, 往往在发布几小时内即获得数百互动。作为对比,OpenLlama Eval点赞目前超过7500,收藏超过400。 该报告作者认为,盘古模型可能在千问模型的基础上进行了增量训练,而非完全从零训练。 事涉华为和阿里,这一报告引发关注。支持者认为,两个模型在众多注意力参数上呈现近乎一致的分布,自然发生(非人为干预)的可能性较低。质疑者则 指出,这一方法过于简化,来自Github、知 ...
盘古大模型与通义千问,谁抄袭了谁?
阿尔法工场研究院· 2025-07-08 12:22
数聚势能 . 全球AIoT产业研究服务平台 以下文章来源于数聚势能 ,作者数聚小信鸽 作者 | 小信鸽 来源 | 数聚势能 导语 :华为盘古3.5与阿里通义千问1.5-7B模型之间的"指纹"相关性,得分高达0.927。 一份GitHub报告带来的"盘古抄袭门" 一切始于 7月4日发布在代码托管平台GitHub上的技术分析报告 。 一位名不见经传的学生(一位自称为哥斯达黎加大学的韩国学生) ,用一种名为"模型指纹"(LLM-Fingerprint)的技术,直指中国两大AI模型巨 头 ——华为与阿里。 报告直指华为盘古大模型v3.5在多个关键特征上与阿里开源的通义千问v1.5高度相似,由此开始一场关于"复用"与"抄袭"的论战。 代码或许不会说谎,但代码的相似性该如何解读? 这不仅是一场技术论战,更是一次对整个AI行业伦理和规则的拷问。 本文无意充当法官,裁定"抄袭"与否。我们将深入剖析这场争议背后的技术细节、开源文化冲突与商业竞争逻辑,探讨它为狂飙突进的大模型时 代,揭示了哪些深层次的挑战与机遇。 "指纹技术"指控:无法忽视的0.927 这场风暴的核心,是一项名为"LLM-Fingerprint"的技术。 简单来 ...
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
Tai Mei Ti A P P· 2025-07-08 03:37
【产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务、云计算、 大数据领域的前沿趋势、重磅政策及行研报告。】 华为诺亚方舟实验室7月5日下午发布最新声明,表示盘古Pro MoE开源模型是基于昇腾硬件平台开发、 训练的基础大模型,并非基于其他厂商模型增量训练而来。 盘古团队表示,"盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源 大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权 声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。" 不过就在7月6日凌晨,一篇发表于Github的文章《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑 暗》,再度引起轩然大波。该文是一位自称华为盘古大模型团队的员工所写。文中揭露内部某团队为伪 造技术突破,多次通过"套壳"续训阿里千问、Deepseek等竞品模型欺上瞒下。 自曝文中称:"经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度, 添加盘古pi论文的一些机制得来,凑够了大概135B的参数。"并表示,"听同事说他们为了洗 ...
华为盘古团队:否认抄袭!
程序员的那些事· 2025-07-06 12:33
但随后,华为盘古大模型(Pangu Pro MoE 72B)被指与阿里巴巴通义千问 Qwen-2.5 14B 模型参 数结构"惊人一致",引发了关于技术原创性与开源合规性的讨论。 6 月 30 日,华为公司宣布开源盘古大模型(Pangu Pro MoE 72B)和基于昇腾的模型推理技术,并 对外公布相关研究论文。对此,华为表示,此举是华为践行昇腾生态战略的又一关键举措,推动大 模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。 质疑的提出 7 月 4 日,一项发布于 GitHub 的研究指出,华为盘古 Pro MoE 模型采用了 LLM - Fingerprint(模 型指纹技术),与阿里通义千问 Qwen-2.5 14B 模型的注意力参数分布存在高度相似性,平均相关 性达 0.927,显著超出模型间正常差异范围,指向"非独立开发"的可能性。 - EOF - 推荐阅读 点击标题可跳转 1、 DeepSeek 对明星道歉上热搜!网友:首次看到 AI 被摁头道歉,笑不活了 2、 腾讯:鸿蒙架构特殊,微信适配必须从零重写代码 7 月 4 日,盘古大模型团队在 GitHub 中进行了回应,否认抄袭 ...
华为回应盘古大模型抄袭;DeepSeek 在海外招聘;马斯克宣布成立“美国党”,明年参加大选|AI 周报
AI前线· 2025-07-06 04:03
整理 | 傅宇琪、褚杏娟 引言:华为盘古团队回应开源模型抄袭;DeepSeek 在海外招聘;字节多维表格 AI 产品负责人王翛 离职二次创业;前月之暗面产品负责人 AI 编程项目获新一轮融资,估值达数亿美金;马斯克宣布成 立"美国党"后,又回应"参选时间":明年;微软宣布年内第二次大规模裁员,被曝将"AI 使用量"纳入员 工考核;苹果或弃自研 AI 模型,考虑使用 Anthropic 或 OpenAI 为 Siri 提供技术支持;员工曝罗马仕 已通知全面停工停产,工资只发到 6 月份;美国取消对华 EDA 出口限制,三大芯片软件商恢复对华 供货;945 万元!AMD CEO 苏姿丰涨工资了,还有 2.4 亿元股票奖励…… 行业热点 华为盘古团队回应开源模型抄袭 华为 6 月 30 日宣布开源盘古 7B 稠密和 72B 混合专家模型后,被质疑抄袭了阿里云通义千问 Qwen-2.5 14B 模型。质疑华为盘古团队抄袭的作者在论文中指出,盘古的 MoE 模型与 Qwen- 2.514B 模型在注意力参数分布上的相关性极高(平均相关性高达 0.927),远超其他模型对比的正 常范围。 7 月 5 日,华为诺亚方舟实验 ...
为什么 DeepSeek 大规模部署很便宜,本地很贵
AI前线· 2025-07-04 06:10
作者 | Sean Goedecke 译者 | 王强 策划 | Tina 什么是批处理推理? GPU 擅长执行大型矩阵乘法(GEMMs,或"通用矩阵乘法")。假设你有一个 token,你想通过模型 传递(即通过乘以其所有权重,其他架构细节不谈)。你将其表示为一个与模型维度(或隐藏大小) 相匹配的向量(即 1x 其大权重矩阵的宽度),然后将其乘过去。那就是 1 个 GEMM。但如果你想 一次通过一批十个 token,也仍然只是一个 GEMM,因为你可以将 token 堆叠成一个矩阵(10x 模 型维度)。这比执行十个稍小的 GEMM 要快得多。因此,推理服务器的实现可能看起来是这样的: 请注意,服务器会决定拉取多大的批次大小。这是吞吐量和延迟之间的权衡。如果你不进行批处理, 只是逐个处理 token,那么没有用户会在队列中等待(上述步骤 3),所以延迟很低(假设你有足够 的 GPU)。然而,如果你进行大量批处理,延迟会很高,因为用户将等待到批次大小填满,但吞吐 量会高得多,因为 GPU 的使用效率更高。 1. 一个请求带着提示词进来 2. 该提示被预填充(通过注意力传递,我们稍后将看到如何将它也做批处理),形成 ...
全国首例!深圳龙岗智慧教育AI平台率先接入华为盘古大模型
Nan Fang Du Shi Bao· 2025-07-02 08:58
龙岗区智慧教育AI平台成为全国首个部署开源盘古大模型的平台,该局也成为全国首家部署开源盘古 大模型的政府部门。此举标志着龙岗区"AI+教育"战略正式迈入 "深度赋能"新阶段。龙岗区将联合区内 优秀人工智能企业协同推进,为核心打造全国"AI+教育"先锋示范城区注入强劲动力。 战略基石: 筑牢教育智能底座 龙岗作为全国教育改革的前沿阵地,深刻地认识到实现从"数字化"到"智能化"的跃升,必须拥有一个强 大、安全、自主创新的AI技术支撑。华为盘古大模型作为全球领先的AI基础设施,成为龙岗教育的必 然选择。 "选择盘古大模型与昇腾硬件,是保障教育数据安全与师生隐私的根基",龙岗区教育局相关负责人强 调,"与华为的紧密合作模式赋予我们前所未有的主动权。我们不再是通用模型的被动用户,而是深度 参与、共同建设的'主人翁'。龙岗多年沉淀的优质教育资源、教学方法和评价体系将融入模型训练,打 造真正'懂龙岗教育、服务龙岗师生'的专属大模型。"此举确保龙岗教育智能化水平持续领先,为培养 未来创新型人才奠定坚实技术基础。 产教协同: 6月30日,华为宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于 ...
AI+医疗:从蚂蚁 AQ 看产业发展
2025-06-30 01:02
AI+医疗:从蚂蚁 AQ 看产业发展 20260629 摘要 蚂蚁集团推出独立 AI 健康应用"AQ",源于支付宝平台在医疗支付和数 字化赋能的积累,以及 AI 健康管家小程序超过 7,000 万的用户基础, 旨在抓住健康赛道的巨大潜力。 "AQ"整合了全国超 5,000 家医院、近百万医生及 200 多位三甲专家资 源,以 AI 为主导、专家为辅,提供在线问诊,旨在缓解医疗资源不均和 看病难问题。AI 在诊前可高效整理病历信息,缩短问诊时间,提升就诊 效率。 医疗 AI 商业化主要体现在医生辅助和高效信息助手,尤其在诊前信息整 理和常见病辅助诊断方面。对于专科病和复杂病,AI 提供评估方案辅助 医生决策,但最终诊断仍由医生决定。 医院对数据安全和隐私保护高度敏感,倾向于私有化部署 AI 服务,导致 对集成 GPU 的 DeepSeeker 一体机需求旺盛,订单金额从几十万到几 千万不等,成为产业商业化收入的重要来源。 医疗 AI 领域倾向于通用大模型与垂类大模型混合架构,以适应细分专业 化医疗需求。关键在于结合特定数据特征、专业医生和专家的数据标注 经验,提升 AI 诊疗质量。 Q&A 蚂蚁集团近期推出的独 ...
华为云CloudRobo亮相:赋能具身智能,不做本体专注平台服务
Sou Hu Cai Jing· 2025-06-23 22:54
具身规划大模型,被形象地称为"具身大脑",它赋予了机器人空间感知、环境理解及复杂推理的能力。 这一模型能够规划出超过十步的复杂任务,并与具身执行模型紧密配合,将任务拆解为精确指令,指导 机器人高效执行任务。 在科技日新月异的2025年,业界迎来了一个被普遍认为是"具身智能元年"的重要时刻。华为开发者大会 2025(HDC 2025)于6月20日盛大召开,会上,华为云计算的掌舵人、常务董事张平安揭晓了一项重量 级成果——CloudRobo具身智能平台。他明确表示,华为云专注于平台搭建,而将机器人的实体制造留 给合作伙伴,旨在让每一个联网的实体都能进化为智能机器人。 CloudRobo平台深度融合了华为盘古大模型的多模态处理与思维能力,构筑了一条从数据合成、标注, 到模型开发、仿真验证,再到云边协同部署与安全监管的完整流程链。其核心涵盖三大模型:具身多模 态生成大模型、具身规划大模型以及具身执行大模型,这些创新工具极大地加速了具身智能的研发进 程。 具身多模态生成大模型如同一座桥梁,连接了数字世界与物理世界,为智能机器人提供了海量、多样化 的训练样本。通过模拟不同光照、视角及物体变化,它不仅提升了数据合成的真实度 ...