华为盘古大模型

Search documents
盘古大模型与通义千问,谁抄袭了谁?
阿尔法工场研究院· 2025-07-08 12:22
数聚势能 . 全球AIoT产业研究服务平台 以下文章来源于数聚势能 ,作者数聚小信鸽 作者 | 小信鸽 来源 | 数聚势能 导语 :华为盘古3.5与阿里通义千问1.5-7B模型之间的"指纹"相关性,得分高达0.927。 一份GitHub报告带来的"盘古抄袭门" 一切始于 7月4日发布在代码托管平台GitHub上的技术分析报告 。 一位名不见经传的学生(一位自称为哥斯达黎加大学的韩国学生) ,用一种名为"模型指纹"(LLM-Fingerprint)的技术,直指中国两大AI模型巨 头 ——华为与阿里。 报告直指华为盘古大模型v3.5在多个关键特征上与阿里开源的通义千问v1.5高度相似,由此开始一场关于"复用"与"抄袭"的论战。 代码或许不会说谎,但代码的相似性该如何解读? 这不仅是一场技术论战,更是一次对整个AI行业伦理和规则的拷问。 本文无意充当法官,裁定"抄袭"与否。我们将深入剖析这场争议背后的技术细节、开源文化冲突与商业竞争逻辑,探讨它为狂飙突进的大模型时 代,揭示了哪些深层次的挑战与机遇。 "指纹技术"指控:无法忽视的0.927 这场风暴的核心,是一项名为"LLM-Fingerprint"的技术。 简单来 ...
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
Tai Mei Ti A P P· 2025-07-08 03:37
【产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务、云计算、 大数据领域的前沿趋势、重磅政策及行研报告。】 华为诺亚方舟实验室7月5日下午发布最新声明,表示盘古Pro MoE开源模型是基于昇腾硬件平台开发、 训练的基础大模型,并非基于其他厂商模型增量训练而来。 盘古团队表示,"盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源 大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权 声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。" 不过就在7月6日凌晨,一篇发表于Github的文章《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑 暗》,再度引起轩然大波。该文是一位自称华为盘古大模型团队的员工所写。文中揭露内部某团队为伪 造技术突破,多次通过"套壳"续训阿里千问、Deepseek等竞品模型欺上瞒下。 自曝文中称:"经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度, 添加盘古pi论文的一些机制得来,凑够了大概135B的参数。"并表示,"听同事说他们为了洗 ...
华为盘古团队:否认抄袭!
程序员的那些事· 2025-07-06 12:33
但随后,华为盘古大模型(Pangu Pro MoE 72B)被指与阿里巴巴通义千问 Qwen-2.5 14B 模型参 数结构"惊人一致",引发了关于技术原创性与开源合规性的讨论。 6 月 30 日,华为公司宣布开源盘古大模型(Pangu Pro MoE 72B)和基于昇腾的模型推理技术,并 对外公布相关研究论文。对此,华为表示,此举是华为践行昇腾生态战略的又一关键举措,推动大 模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。 质疑的提出 7 月 4 日,一项发布于 GitHub 的研究指出,华为盘古 Pro MoE 模型采用了 LLM - Fingerprint(模 型指纹技术),与阿里通义千问 Qwen-2.5 14B 模型的注意力参数分布存在高度相似性,平均相关 性达 0.927,显著超出模型间正常差异范围,指向"非独立开发"的可能性。 - EOF - 推荐阅读 点击标题可跳转 1、 DeepSeek 对明星道歉上热搜!网友:首次看到 AI 被摁头道歉,笑不活了 2、 腾讯:鸿蒙架构特殊,微信适配必须从零重写代码 7 月 4 日,盘古大模型团队在 GitHub 中进行了回应,否认抄袭 ...
华为回应盘古大模型抄袭;DeepSeek 在海外招聘;马斯克宣布成立“美国党”,明年参加大选|AI 周报
AI前线· 2025-07-06 04:03
整理 | 傅宇琪、褚杏娟 引言:华为盘古团队回应开源模型抄袭;DeepSeek 在海外招聘;字节多维表格 AI 产品负责人王翛 离职二次创业;前月之暗面产品负责人 AI 编程项目获新一轮融资,估值达数亿美金;马斯克宣布成 立"美国党"后,又回应"参选时间":明年;微软宣布年内第二次大规模裁员,被曝将"AI 使用量"纳入员 工考核;苹果或弃自研 AI 模型,考虑使用 Anthropic 或 OpenAI 为 Siri 提供技术支持;员工曝罗马仕 已通知全面停工停产,工资只发到 6 月份;美国取消对华 EDA 出口限制,三大芯片软件商恢复对华 供货;945 万元!AMD CEO 苏姿丰涨工资了,还有 2.4 亿元股票奖励…… 行业热点 华为盘古团队回应开源模型抄袭 华为 6 月 30 日宣布开源盘古 7B 稠密和 72B 混合专家模型后,被质疑抄袭了阿里云通义千问 Qwen-2.5 14B 模型。质疑华为盘古团队抄袭的作者在论文中指出,盘古的 MoE 模型与 Qwen- 2.514B 模型在注意力参数分布上的相关性极高(平均相关性高达 0.927),远超其他模型对比的正 常范围。 7 月 5 日,华为诺亚方舟实验 ...
为什么 DeepSeek 大规模部署很便宜,本地很贵
AI前线· 2025-07-04 06:10
作者 | Sean Goedecke 译者 | 王强 策划 | Tina 什么是批处理推理? GPU 擅长执行大型矩阵乘法(GEMMs,或"通用矩阵乘法")。假设你有一个 token,你想通过模型 传递(即通过乘以其所有权重,其他架构细节不谈)。你将其表示为一个与模型维度(或隐藏大小) 相匹配的向量(即 1x 其大权重矩阵的宽度),然后将其乘过去。那就是 1 个 GEMM。但如果你想 一次通过一批十个 token,也仍然只是一个 GEMM,因为你可以将 token 堆叠成一个矩阵(10x 模 型维度)。这比执行十个稍小的 GEMM 要快得多。因此,推理服务器的实现可能看起来是这样的: 请注意,服务器会决定拉取多大的批次大小。这是吞吐量和延迟之间的权衡。如果你不进行批处理, 只是逐个处理 token,那么没有用户会在队列中等待(上述步骤 3),所以延迟很低(假设你有足够 的 GPU)。然而,如果你进行大量批处理,延迟会很高,因为用户将等待到批次大小填满,但吞吐 量会高得多,因为 GPU 的使用效率更高。 1. 一个请求带着提示词进来 2. 该提示被预填充(通过注意力传递,我们稍后将看到如何将它也做批处理),形成 ...
全国首例!深圳龙岗智慧教育AI平台率先接入华为盘古大模型
Nan Fang Du Shi Bao· 2025-07-02 08:58
龙岗区智慧教育AI平台成为全国首个部署开源盘古大模型的平台,该局也成为全国首家部署开源盘古 大模型的政府部门。此举标志着龙岗区"AI+教育"战略正式迈入 "深度赋能"新阶段。龙岗区将联合区内 优秀人工智能企业协同推进,为核心打造全国"AI+教育"先锋示范城区注入强劲动力。 战略基石: 筑牢教育智能底座 龙岗作为全国教育改革的前沿阵地,深刻地认识到实现从"数字化"到"智能化"的跃升,必须拥有一个强 大、安全、自主创新的AI技术支撑。华为盘古大模型作为全球领先的AI基础设施,成为龙岗教育的必 然选择。 "选择盘古大模型与昇腾硬件,是保障教育数据安全与师生隐私的根基",龙岗区教育局相关负责人强 调,"与华为的紧密合作模式赋予我们前所未有的主动权。我们不再是通用模型的被动用户,而是深度 参与、共同建设的'主人翁'。龙岗多年沉淀的优质教育资源、教学方法和评价体系将融入模型训练,打 造真正'懂龙岗教育、服务龙岗师生'的专属大模型。"此举确保龙岗教育智能化水平持续领先,为培养 未来创新型人才奠定坚实技术基础。 产教协同: 6月30日,华为宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于 ...
华为云CloudRobo亮相:赋能具身智能,不做本体专注平台服务
Sou Hu Cai Jing· 2025-06-23 22:54
具身规划大模型,被形象地称为"具身大脑",它赋予了机器人空间感知、环境理解及复杂推理的能力。 这一模型能够规划出超过十步的复杂任务,并与具身执行模型紧密配合,将任务拆解为精确指令,指导 机器人高效执行任务。 在科技日新月异的2025年,业界迎来了一个被普遍认为是"具身智能元年"的重要时刻。华为开发者大会 2025(HDC 2025)于6月20日盛大召开,会上,华为云计算的掌舵人、常务董事张平安揭晓了一项重量 级成果——CloudRobo具身智能平台。他明确表示,华为云专注于平台搭建,而将机器人的实体制造留 给合作伙伴,旨在让每一个联网的实体都能进化为智能机器人。 CloudRobo平台深度融合了华为盘古大模型的多模态处理与思维能力,构筑了一条从数据合成、标注, 到模型开发、仿真验证,再到云边协同部署与安全监管的完整流程链。其核心涵盖三大模型:具身多模 态生成大模型、具身规划大模型以及具身执行大模型,这些创新工具极大地加速了具身智能的研发进 程。 具身多模态生成大模型如同一座桥梁,连接了数字世界与物理世界,为智能机器人提供了海量、多样化 的训练样本。通过模拟不同光照、视角及物体变化,它不仅提升了数据合成的真实度 ...
华为云CloudRobo平台:赋能具身智能,不造本体创未来
Sou Hu Cai Jing· 2025-06-23 22:42
在科技界翘首以盼的2025年,被誉为"具身智能元年"的这一年里,科技创新的浪潮再次被掀起。华为开 发者大会2025(HDC 2025)于6月20日盛大召开,会上,华为云计算的掌舵人、常务董事张平安向全球 开发者揭晓了CloudRobo具身智能平台,这一平台的发布标志着华为云在具身智能领域的重大布局。 张平安明确表示,华为云并不涉足机器人本体的制造,而是致力于携手合作伙伴,共同推进具身智能的 发展。他的愿景是,让每一个联网的实体都能化身为智能机器人,这一宏伟蓝图在CloudRobo平台的发 布下,正逐步变为现实。 CloudRobo平台基于华为盘古大模型的多模态与思维能力,集成了从数据合成到云边协同部署的一系列 端到端能力。该平台核心包含了三大模型:具身多模态生成大模型、具身规划大模型以及具身执行大模 型,这些模型共同加速了具身智能的创新进程。 具身规划大模型,被形象地称为"具身大脑",它拥有空间感知、环境交互理解和具身推理的能力,能够 针对机器人在真实环境中的需求,进行复杂的多步骤任务规划。这一模型与具身执行模型协同工作,将 规划拆解为可执行指令,驱动机器人本体高效完成任务。 而具身执行大模型,则如同智能机器 ...
刚刚,华为盘古大模型5.5问世!推理、智能体能力大爆发
机器之心· 2025-06-20 11:59
就在刚刚,在华为开发者大会 2025(HDC 2025)上,华为重磅发布了 盘 古大 模型 5.5 ,其中自然语言处理(NLP)能力比肩国际一流模型,并在多模态世界模 型方面做到全国首创。 此次,全新升级的盘古大模型 5.5 包含了 五大基础模型 ,分别面向 NLP 、 多模态 、 预测 、 科学计算 、 CV 领域,进一步推动大模型成为行业数智化转型的核 心动力。 华为常务董事、华为云 CEO 张平安正式发布盘古大模型 5.5 会上,华为诺亚方舟实验室主任王云鹤对该系列模型的核心技术进行了大揭秘。 机器之心报道 编辑:杜伟、Panda 在国产大模型领域,华为盘古大模型一直是比较独特的存在。 该系列模型强调「不作诗,只做事」,深耕行业,赋能千行百业,推动产业智能化升级。从盘古 1.0 到盘古 5.0,华为专注于用大模型解决实际产业问题,并获得 了市场的广泛认可。 王云鹤 此次,盘古 5.5 在 NLP 领域主要有三大模型组成,即 盘古 Ultra MoE 、 盘古 Pro MoE 、 盘古 Embedding ;以及快慢思考合一的 高效推理策略 、盘古深度研究 产品 DeepDiver 。 我们接下来一一来看 ...
9位顶级研究员连讲3晚,华为盘古大模型底层研究大揭秘
机器之心· 2025-05-26 10:59
近年来,大语言模型(LLMs)在自然语言处理、代码生成、多模态理解等领域发展迅速,已成为通用人工 智能系统的重要基石。 19:00-19:40 然而,模型能力的提升伴随着计算资源与存储需求的急剧增长,如何实现高性能与高效率并存,已成为 AI 面临的重要挑战。 作为 AI 领域的先行者, 华为诺亚方舟实验室 正在用前沿研究给出答案。 今年 4 月,该团队成功开发出基于昇腾算力训练的千亿级通用语言大模型 Pangu Ultra。在多个领域和评测 上超越之前 Llama 405B 和 Mistral Large 2 等密集模型,并可以与 DeepSeek-R1 等更大规模的稀疏模型一较 高下。 5 月初,他们又推出了稀疏大语言模型 Pangu Ultra MoE,并且实现了在 6000 + 块昇腾 NPU 上对 MoE 模型 的长期稳定训练。 想了解更多关于该团队在大模型方面的技术积累与研究成果? 5 月 28 日至 30 日,每晚 19:00 至 21:00,机器之心联合 华为诺亚方舟实验室举办系列分享会,带来包括量 化、剪枝、MoE 架构优化、KV 优化等多个关键技术方向的最新突破。 三晚连播,干货密集,值得每 ...