通义千问Qwen

Search documents
阿里通义千问,重大更新!三大亮点
Zheng Quan Shi Bao· 2025-07-12 04:09
Core Insights - Alibaba's Tongyi Qianwen team announced significant updates to its AI chat product Qwen Chat, enhancing user interaction and adding practical features [1][2] Group 1: Product Updates - Users can now start conversations directly from the Tongyi Qianwen homepage, improving accessibility and immediacy [2] - Qwen Chat integrates multiple functionalities, including "in-depth research," "image generation," "web development," "deep thinking," and "search," allowing users to generate high-quality images from text descriptions and assist front-end engineers in coding [2][3] - A new desktop client has been introduced, enabling one-click access to the Model Context Protocol (MCP) and facilitating cross-application calls and automated task execution [2][3] Group 2: Competitive Positioning - Alibaba's Tongyi Qianwen is recognized as the largest open-source model globally, with a 23% market share in China's AI infrastructure (AIIaaS), surpassing the combined share of the second and third players [4] - The company reported that its "cloud + AI" strategy has become a new growth engine, with Alibaba Cloud achieving a revenue of 1180.28 billion yuan in the 2025 fiscal year, marking an 11% year-on-year increase [4] - AI-related product revenues have seen triple-digit growth for seven consecutive quarters, indicating strong demand in the market [4] Group 3: Investment and Future Plans - Alibaba plans to invest 380 billion yuan in AI infrastructure over the next three years, exceeding its total tech investments from the past decade [5] - The company announced a plan to issue zero-coupon exchangeable bonds worth approximately 12 billion Hong Kong dollars to fund cloud computing infrastructure and support international e-commerce development [5]
华为盘古大模型事件的“三重门”
Jing Ji Guan Cha Wang· 2025-07-09 22:55
经济观察报 记者 周悦 7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种"模型指纹"技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。 经济观察报检索该报告引用的文献内容,发现部分文献无法在公开数据库中查验。截至发稿前,该报告已经在Github删除,HonestAGI主页无法找到。 此外,原报告发布在GitHub页面,但点赞(stars)、收藏(forks)等数据数较低;相比之下,其他具备社区共识的模型安全/评估工具如OpenLlama Eval等, 往往在发布几小时内即获得数百互动。作为对比,OpenLlama Eval点赞目前超过7500,收藏超过400。 该报告作者认为,盘古模型可能在千问模型的基础上进行了增量训练,而非完全从零训练。 事涉华为和阿里,这一报告引发关注。支持者认为,两个模型在众多注意力参数上呈现近乎一致的分布,自然发生(非人为干预)的可能性较低。质疑者则 指出,这一方法过于简化,来自Github、知 ...
华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印
Qi Lu Wan Bao· 2025-07-07 03:50
2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这 是构建昇腾生态的关键举措。 然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过"LLM指纹"技术分析指出,盘古Pro MoE与阿里通义千问 Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。 华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模 型增量训练而来。 盘古团队表示,"盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循 开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。" 华为诺亚方舟实验室声明截图 该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型 实验室多 ...
事关大模型,盘古团队声明
新华网财经· 2025-07-06 06:43
Core Viewpoint - Huawei's announcement of the open-source Pangu Pro MoE model with 720 billion parameters and the Pangu model with 70 billion parameters has sparked industry discussions regarding the similarities between the Pangu Pro MoE model and Alibaba's Tongyi Qwen-2.5 14B model in terms of parameter structure [1][2]. Group 1 - The Noah's Ark Lab stated that the Pangu Pro MoE model is developed and trained based on the Ascend hardware platform and is not an incremental training of other vendors' models [1]. - A GitHub study found a high correlation of 0.927 in attention parameter distribution between the Pangu Pro MoE model and the Tongyi Qwen-2.5 model, indicating significant structural similarities [1]. - Noah's Ark Lab clarified that while some code implementations of the Pangu Pro MoE model reference industry open-source practices, they strictly adhere to open-source license requirements and clearly mark copyright statements [1][2]. Group 2 - Industry analysts suggest that the Pangu Pro MoE model likely did not use the pre-trained weights of the Tongyi Qwen-2.5 model as initialization parameters, as there are essential differences in the absolute value distribution of biases [2]. - The structural consistency between the two models may stem from shared architectural design principles, which is common in large models as good structures are widely adopted [2]. - Noah's Ark Lab emphasized that the Pangu Pro MoE model features key innovations, being the first mixed expert model designed for the Ascend hardware platform, and introduced a grouped mixed expert model (MoGE) architecture to enhance training efficiency [2]. Group 3 - Noah's Ark Lab expressed gratitude to global developers and partners for their support of the Pangu model and highlighted the importance of constructive feedback from the open-source community [3]. - The lab aims to optimize model capabilities through collaboration with like-minded partners, accelerating technological breakthroughs and industry applications [3].
AI周报|华为盘古团队否认开源模型抄袭;英伟达市值逼近4万亿美元
Di Yi Cai Jing· 2025-07-06 01:52
苹果或弃自研模型转投OpenAI和Anthropic;Meta成立超级智能实验室。 华为盘古团队否认开源模型抄袭 7月5日,华为诺亚方舟实验室发布声明称,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基 础大模型,并非基于其他厂商模型增量训练而来。对此,盘古团队在声明中称,盘古Pro MoE开源模型 部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。盘古团队严格遵 循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。 点评:华为此前6月30日宣布开源盘古7B稠密和72B混合专家模型,随后,一项发布于GitHub的研究引 发业界热议,该研究的作者认为,华为推出的盘古大模型与阿里巴巴发布的通义千问Qwen-2.5 14B模型 在参数结构上存在"惊人一致",两个模型在注意力参数分布上的平均相关性高达0.927,远超其他模型 对比的正常范围。 英伟达市值逼近4万亿美元 当地时间7月3日盘中,英伟达市值一度突破3.92万亿美元,短暂超过苹果在2024年年底时创下的3.915万 亿美元全球最高市值,并逼近4万亿美元。截至7月3日收盘,英伟达股价上涨1.33%,股价159.3 ...
华为盘古团队声明:严格遵循开源要求
Guan Cha Zhe Wang· 2025-07-05 09:32
Core Viewpoint - Huawei's Pangu Pro MoE model has been recognized for its innovative design that utilizes dynamic activation of expert networks, achieving superior performance. However, a recent GitHub study claims that the model shares a "striking similarity" in parameter structure with Alibaba's Qwen-2.5 14B model [1]. Group 1: Model Development and Innovation - The Pangu Pro MoE model is developed and trained on the Ascend hardware platform and is not based on incremental training from other vendors' models. It features significant innovations in architecture and technical characteristics [2]. - The model introduces the Grouped Mixture of Experts (MoGE) architecture, which effectively addresses load balancing challenges in large-scale distributed training, thereby enhancing training efficiency [1][2]. Group 2: Open Source Compliance and Community Engagement - Huawei emphasizes that some foundational components of the Pangu Pro MoE model's code implementation reference industry open-source practices and include portions of open-source code from other models. The company adheres strictly to open-source license requirements and clearly marks copyright statements in the open-source code files [2]. - The company promotes an open innovation approach, respecting third-party intellectual property, and advocates for an inclusive, fair, open, united, and sustainable open-source philosophy [2]. - Huawei expresses gratitude to global developers and partners for their support of the Pangu model and highlights the importance of constructive feedback from the open-source community [2].
你的下一个AI项目灵感,藏在首届魔搭开发者大会的七大论坛里
机器之心· 2025-07-01 05:01
开放、协作、共享的社区生态成为推动 AI 浪潮奔涌向前的核心动力。正是在这样的背景下,一个能够 汇 聚 顶 尖 智 慧 、 提 供 全 方 位 支 持 、 连 接 创 造 者 与 使 用 者 的 平 台 , 显 得 至 关 重 要 。 魔 搭 社 区 (ModelScope) 正是顺应这一需求而发展的。 6 月 30 日,首届魔搭开发者大会在北京举办。自 2022 年 11 月初成立以来,历经两年多高速发展, 社区已汇聚超 500 家贡献机构,托管的开源模型数量已超 7 万个,增长超 200 倍,用户数量从 2023 年 4 月的 100 万扩展至如今 1600 万,增长约 16 倍。 机器之心报道 编辑:+0 此刻我们正处在什么样的时代?是姚顺雨笔下的「AI 的下半场」,是 Andrej Karpathy 定义的「软件 3.0 时代」,也是一个创造者与 AI 协同进化,重新定义「可能」的时代。 层出不穷的创新模型以前所未有的速度涌现,深刻地改变着世界的每一个角落。对于开发者而言,这既 是充满无限机遇的黄金时代,也带来了前所未有的挑战: 如何紧跟技术前沿,高效地获取、使用并创 造 AI 模型? 魔搭社区已形成 ...
赛道Hyper | 通义千问推出多模态模型Qwen VLo
Hua Er Jie Jian Wen· 2025-07-01 02:58
在这个过程中,模型不断对预测内容调整优化,比如生成风景图时,先勾勒山川河流轮廓,再细化树 木、花草等细节,确保画面在结构、色彩、语义等方面和谐统一。 这种生成机制给用户更灵活、可控的创作体验,设计师创作海报时,可实时观察生成过程,及时调整不 协调部分,让创作更贴合预期。 作者:周源/华尔街见闻 阿里云在中国生成式AI基础设施登顶。 据IDC刚刚发布的最新报告显示,2024年中国AI基础设施(AI IaaS)市场份额,阿里云占比23%,位列 中国市场第一,超过第二名和第三名总和;在生成式AI基础设施领域,阿里云取得模型训练和模型推 理市场的双项冠军。 阿里云的生成式推理模型迭代频繁,动作很多。 6月27日,阿里云通义千问推出多模态统一理解与生成模型Qwen VLo,用户可通过Qwen Chat (chat.qwen.ai)体验。 这一模型在人工智能领域传承与创新,为多模态人工智能发展带来新探索,具备理解和基于理解进行再 创造的能力。 Qwen VLo采用渐进式生成方式,在生成图像时从左到右、从上到下逐步构建画面。 Qwen VLo通过提升细节捕捉能力,在生成中保持较高语义一致性。 当用户输入汽车照片并要求"将颜 ...
华为、百度同日宣布大动作:开源!
第一财经· 2025-06-30 12:16
2025.06. 30 本文字数:2764,阅读时长大约5分钟 作者 | 第一财经 刘佳、李娜、陈杨园 2025上半年的最后一天,百度和华为都想"开"了。今日两家公司各自宣布了最新的开源动作。 其中,百度一口气开源了文心大模型4.5系列的10款模型,涵盖47B、3B激活参数的混合专家 (MoE)模型与0.3B参数的稠密型模型等,并称实现预训练权重和推理代码的完全开源;华为则宣 布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理 技术。 半年后,当"黑马"DeepSeek以低成本高效率的开源模型突袭并引发全球关注,搜索已经成为AI工 具、AI助手标配的背景下,百度变了。今年2月,百度宣布从4月1日起文心一言全部免费,上线深度 搜索功能,紧接着又宣布在未来几个月中陆续推出文心大模型4.5系列,并将在6月30日开源。 同样,在华为内部,对于开源也经历了许久的权衡与纠结。例如,从业务层面,基于昇腾下的军团以 及政企业务线板块的算力买卖或面临着一定的压力。但最终,华为站在了开源大军的队伍里。 "盘古72B是兼顾性能与推理成本的黄金尺寸,最适合行业用户用AI改造业务。"华为 ...
阿里缩减合伙人人数,AI纳入核心业务范畴
雷峰网· 2025-06-30 11:21
" 留下有话事权的人,做将业务更聚焦的事 。 " 作者丨梁辰 编辑丨董子博 少了437个字,少了9个人。 6月26日晚间,阿里巴巴集团发布2025财年年报。业绩数据早在一个月前公布,年报的重点是管理层对战 略和业务的思考,而"致股东的信"是整个年报的精髓。 对比发现,2025财年少了一页A4纸的描述。内容上,年报不再单独展开阐述"经营原则",转而反复强调 AI的重要性,甚至 将AI增补进"核心业务"范畴,将"电商和云计算"变为"电商、AI+云" 。 另一个巨大的变化是,多位阿里巴巴各个时期的关键人物退出阿里合伙人,其中既有创业"十八罗汉"中的 彭蕾、戴珊,又有前CEO张勇、前CFO武卫,还有曾被视为"接班人"的俞永福。 一位二级市场分析师告诉雷峰网,这次退出的合伙人很多已经离开阿里巴巴, 当然可以说是给吴泳铭和蒋 凡扫清障碍 ,由于这些人长期不在业务一线,所以不再参与日常经营管理决策,也有利于企业良性运行。 作为阿里巴巴最重要的决策机构,合伙人的进出一直有着严格的规定。此次年报披露,共有9人退出,并 没有补入新合伙人。 不仅如此,阿里巴巴此次披露合伙人在阿里巴巴集团职位罗列也更加精简,不再罗列他们在子业务集团 ...