Workflow
通义千问(Qwen)
icon
Search documents
算力催生数据中心向智算发展,推动PCB向高阶升级迭代,看好相关产业链投资机会
Great Wall Securities· 2025-07-09 06:37
证券研究报告 | 行业周报 2025 年 07 月 09 日 通信 算力催生数据中心向智算发展,推动 PCB 向高阶升级迭代,看好相 关产业链投资机会 | 股票 | 股票 | 投资 | EPS (元) | | PE | | | --- | --- | --- | --- | --- | --- | --- | | 代码 | 名称 | 评级 | 2025E | 2026E | 2025E | 2026E | | 002881.SZ | 美格智能 | 买入 | 0.73 | 0.92 | 61.56 | 48.85 | | 301285.SZ | 鸿日达 | 买入 | 0.21 | 0.7 | 161.9 | 48.57 | | 600941.SH | 中国移动 | 买入 | 6.77 | 7.17 | 16.54 | 15.61 | | 601728.SH | 中国电信 | 买入 | 0.38 | 0.4 | 20.08 | 19.08 | 资料来源:长城证券产业金融研究院 本周策略观点: OpenA I向甲骨文租赁数据中心算力,看好未来 AIDC 产业链投资机会。据 据《金融时报》和彭博社援引知情人士报道,O ...
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 06:49
Core Viewpoint - The article discusses the rapid rise of large model technology globally, emphasizing Alibaba's Tongyi Qwen model's international success and its strategic focus on multilingual capabilities to cater to a global audience [2][3]. Group 1: Multilingual Strategy - Tongyi Qwen supports 119 languages, with a core strategy prioritizing multilingual data optimization from the outset to ensure equitable access to AI technology for global users [2][3]. - The team has developed a complex cultural annotation system to address the challenges of multilingual safety and cultural alignment, covering thousands of detailed categories to ensure compliance and effectiveness across different regions [3][12]. - The current industry faces a "multilingual reasoning challenge," where models often mix languages during processing, leading to inconsistencies. The team has adopted a compromise strategy to use native languages for strong languages and English for low-resource languages to maintain output stability [3][16]. Group 2: Scaling Law and Knowledge Density - The article highlights the importance of scaling model size and data volume while also focusing on increasing "knowledge density," which refers to the concentration of useful knowledge within the training data [19][20]. - Recent trends show that smaller models with higher knowledge density can outperform larger models, indicating a shift in focus from merely increasing data volume to refining data quality [20][21]. - The team is exploring data synthesis methods to enhance training data quality, which includes generating new knowledge and filtering redundant data to improve knowledge density [22][23]. Group 3: AI Integration and Future Prospects - The integration of AI models into various devices, such as smart glasses and earphones, is a growing trend, with the company planning to release smaller model versions optimized for these applications [28][30]. - The article discusses the potential for AI to enhance user experiences in everyday tasks, such as real-time translation and contextual assistance, although challenges remain in achieving seamless integration [30][32]. - The company acknowledges the importance of balancing the use of synthetic data with human-generated content to maintain diversity and avoid narrowing the model's knowledge base [25][26].
8点1氪|印度坠机事故造成至少265人死亡,机上仅1人幸存;韦东奕涨粉速度获世界纪录认证;哪吒汽车CEO被员工围堵讨薪
3 6 Ke· 2025-06-12 23:38
上市进行时 联合动力 36氪获悉,深交所上市委公告,苏州汇川联合动力系统股份有限公司(简称"联合动力")首发获通过。 杰华特微电子 36氪获悉,港交所文件显示,杰华特微电子股份有限公司向港交所提交上市申请书。 TOP3大新闻 印度坠机事故造成至少265人死亡,机上仅1人幸存 12日下午,一架印度航空公司的波音787客机从印度西部古吉拉特邦起飞后坠毁。失事客机上载有242 人。印度警方公布的最新数据显示,本次事故造成至少265人死亡。当地时间12日,印度内政部长阿米 特·沙阿确认仅有一名机上乘客在这起事故中幸存,有关部门正在采集机上人员亲属的DNA样本,死者 名单将在DNA检测结束后公布。除机上人员外,事故还造成地面人员伤亡,古吉拉特邦卫生部门官员 在事发后表示,已有至少50名地面人员被送往医院接受治疗。北京时间13日凌晨,印度民航部宣布,本 次事故的现场搜救行动已经结束。(央视新闻) 韦东奕涨粉速度获世界纪录认证,每分钟涨440个 据报道,近日,北大数学科学学院教师韦东奕因为入驻短视频平台并发布一条视频,引起舆论关注。目 前,韦东奕账号粉丝量已经接近2500万,视频点赞量接近1500万。据世界纪录认证机构(W ...
8点1氪:印度坠机事故造成至少265人死亡,机上仅1人幸存;韦东奕涨粉速度获世界纪录认证;哪吒汽车CEO被员工围堵讨薪
36氪· 2025-06-12 23:34
12日下午,一架印度航空公司的波音787客机从印度西部古吉拉特邦起飞后坠毁。失事客机上载有242人, 除机上人员外,事故还造成地面人员 伤亡。 整理 |丁丁炒面 点击上方【36氪随声听】,一键收听大公司热门新闻。听完音频记得添加进入 【我的小程序】 中哟! 联合动力 36氪获悉,深交所上市委公告,苏州汇川联合动力系统股份有限公司(简称"联合动力")首发获通过。 杰华 特微 电子 36氪获悉,港交所文件显示,杰华特微电子股份有限公司向港交所提交上市申请书。 印度坠机事故造成至少265人死亡,机上仅1人幸存 12日下午,一架印度航空公司的波音787客机从印度西部古吉拉特邦起飞后坠毁。失事客机上载有242人。印度警方公布的最新数据显示,本次事故造成 至少265人死亡。当地时间12日,印度内政部长阿米特·沙阿确认仅有一名机上乘客在这起事故中幸存,有关部门正在采集机上人员亲属的DNA样本,死者 名单将在DNA检测结束后公布。除机上人员外,事故还造成地面人员伤亡,古吉拉特邦卫生部门官员在事发后表示,已有至少50名地面人员被送往医院 接受治疗。北京时间13日凌晨,印度民航部宣布,本次事故的现场搜救行动已经结束。(央视新闻) ...
三位顶流AI技术人罕见同台,谈了谈AI行业最大的「罗生门」
3 6 Ke· 2025-05-28 11:59
文|周鑫雨 编辑|苏建勋 预训练还是不是王道?如今AI行业,这是最大的"罗生门"事件。 2023年,模型预训练,还是第一性原理。然而,从OpenAI前首席科学家Ilya公开喊话"预训练已走到尽头",到聚焦强化学习的DeepSeek R1出圈,又昭示着 预训练风光不再。 从人人追捧,到口碑滑坡,预训练境遇的变化,是AI行业"共识"与"非共识"不断流动的一个缩影。 针对AI技术的共识与非共识,2025年5月27日的"技术开放日"上,蚂蚁集团攒了一个交流局。 圆桌对话的参与者,是当下最热的创业者、技术高管和学者: 曹越,视频模型公司Sand.AI创始人,前光年之外联创。2024年7月完成两轮融资后,公司估值已经超过1亿美元; 林俊旸,阿里通义千问(Qwen)技术负责人。从2021年发布的M6,到2025年的Qwen3,他都是名副其实的模型一把手; 孔令鹏,香港大学助理教授、NLP LAB联合主任。其牵头研发的扩散推理模型Dream 7B,成为了开源扩散语言模型的新SOTA。 △图源:作者拍摄 某种意义上,曹越和孔令鹏,都在探寻AI"非共识"的过程中收获颇丰——他们都试图将语言模型和视觉模型训练的主流架构,分别应用到 ...
阿里的AI转型与进化
硬AI· 2025-05-15 15:04
图 点击 上方 硬AI 关注我们 靠AI获得科技成长公司叙事。 硬·AI 作者 | 小 猫 编辑 | 硬 AI 观察近期科技巨头的财报,一个显著的共同点是 AI投入的急剧增加及其对增长驱动的逐步显现。 亚马逊 CEO Andy Jassy在财报电话会议中多次强调,AWS的增长 源于 企业对 AI的旺盛需求,并表示"AI 将 成为亚马逊未来几十年最大的业务之一 "。Meta将AI列为核心战略,扎克伯格强调AI正驱动广告业务的精准 度和效率提升。 行业共识正在形成, AI已从前期的"实验性探索"阶段,大步迈向了驱动增长的"经营杠杆"阶段。"全年百亿 美金"级别的算力采购与AI研发投入,正成为顶尖科技玩家的常态。 阿里巴巴在这一轮科技转型中展现出同样的战略眼光。市场认知随之发生转变 ——阿里不再仅是中国领先 的电商平台, 而是一家具有 全球竞争力的科技企业 ,其战略重心正向 AI倾斜。 这一转变不仅体现在企业战略定位上, 更在技术进化和产业应用等方面得到印证 。 01 这与全球科技巨头在 AI资本开支曲线上进入S型中段的趋势相吻合,即大规模、持续性的AI基础设施投入已 成为行业标配。 本季度,公司 Capex 24 ...
最狠的是这两句话
信息平权· 2025-05-13 14:37
大家都看到了,今晚BIS正式废除了拜登的AI扩散规则,市场风偏明显改善,被关税和宏观左右了2个 月,终于看到AI叙事重新占据主导(至少今晚) 上述都被几天前的彭博新闻提前曝光了。 但最大增量信息是下面几句话 ,非常值得琢磨: 也就是BIS打算替换的新规则的核心思想: 1. 在全世界任何地方使用华为昇腾芯片都违反了出口管制 2. 对使用美国芯片训练和推理中国AI模型,会警告 这两句话信息量其实很大 1. 中国本地难道也不能使用昇腾芯片?BAT如果用了就违反美国的出口管制,会怎样? 2. 不能使用美国芯片训练推理中国模型,这招看起来挺狠。意思是即便中国用各种方式拿到了NV卡, 也只能推理你美国模型?但目前仅说会警告(黄牌),作为开源模型,层层套壳...这种监督可能很难落 地执行。何况还是跨国监督,未免有点手伸太长、想管的太多了吧... 3. 不过对海外云厂来说,意味着海外CSP但凡去host Qwen或者deepseek,都会被警告公众?但是否有 进一步限制措施?如果只是警告,那相当于没有了制裁? 因此看到这儿,可以划分下,哪些是BIS能管的哪些不能管。 美国公司海外推理,不能用华为昇腾(这 个也还没指望过... ...
OpenAI全球扩展计划揭秘:表面推广“民主AI”,暗里为巩固自己地位
3 6 Ke· 2025-05-08 07:56
OpenAI还称,这项举措将"推动AI成果的广泛分配,并助力公司使命的推进"。该公司还表示,与美国政府的密切合作是"推广民主AI的最佳方 式"。 在具体操作层面,OpenAI在其博客中表示,该计划的重点包括:在海外建设数据中心;推出符合各国语言与文化特点的本地化ChatGPT;加强 AI系统的安全性与可靠性;并在不同国家设立由本地资金与OpenAI共同出资的国家级创业基金。 OpenAI此举与特朗普政府"不惜一切代价赢得AI竞赛"的策略不谋而合。该政策旨在保护美国经济利益,同时在日益激烈的地缘政治AI博弈中 取得主导地位。 分析机构Futurum Group首席执行官丹尼尔·纽曼(Daniel Newman)指出,这表明美国已经意识到AI技术将在未来决定全球经济领导权。他还 援引美国财政部长斯科特·贝森特(Scott Bessent)的话说:"美国必须赢得AI与量子科技竞赛,其他都无足轻重。" 托尼·布莱尔研究所新兴技术与地缘政治高级政策顾问基根·麦克布赖德也表达了类似观点。他表示,美国政策制定者对中国在全球范围内积极 推动数字基础设施建设感到担忧。尤其是今年1月,中国发布了推理能力堪比美国顶级模型的Deep ...
阿里“通义千问”成为日本AI开发基础
日经中文网· 2025-05-07 02:45
阿里云的AI模型"通义千问(Qwen)"(REUTERS) 日本野村综合研究所的李智慧就通义千问指出:"由于能以较少的数据集实现较高的精度,因 此在多个指标上的高度的日语能力得到了评价"。 在日经4月公开的"AI模型评分"榜中,阿里云的"通义千问(Qwen)"模型超过了中国DeepSeek 的模型,在113个模型中位居第6。作为开源模型,通义千问正在得到很多日本新兴企业的使用。在 评分榜位居日本企业首位的模型正是基于通义千问开发…… 中国阿里巴巴集团旗下的阿里云(Alibaba Cloud)的人工智能(AI)模型"通义千问(Qwen)"在 日本的存在感在提高。 作为向外部开放技术的开源模型,通义千问正在得到包括AI开发企业 ABEJA等日本国内新兴企业的使用。 在日本经济新闻(中文版: 日经中文网)4月公开的"AI模型 评分"榜中,通义千问的模型超过了中国DeepSeek的模型,位居第6。 ABEJA于4月17日发布了新模型"QwQ-32B Reasoning Model"。该模型为能够进行连贯性思考 并输出答案的逻辑推理型,展现出了很高的性能。该模型的开发基础正是阿里巴巴的通义千 问模型。 通义千问在日本以 ...
通义千问 Qwen3 发布,对话阿里周靖人
晚点LatePost· 2025-04-29 08:43
以下文章来源于晚点对话 ,作者程曼祺 晚点对话 . 最一手的商业访谈,最真实的企业家思考。 阿里云 CTO、通义实验室负责人 周靖人 "大模型已经从早期阶段的初期,进入早期阶段的中期,不可能只在单点能力上改进了。" Qwen3 旗舰模型,MoE(混合专家模型)模型 Qwen3-235B-A22B,以 2350 亿总参数、220 亿激活参数,在 多项主要 Benchmark(测评指标)上超越了 6710 亿总参数、370 亿激活参数的 DeepSeek-R1 满血版。更小 的 MoE 模型 Qwen3-30B-A3B,使用时的激活参数仅为 30 亿,不到之前 Qwen 系列纯推理稠密模型 QwQ- 32B 的 1/10,但效果更优。更小参数、更好性能,意味着开发者可以用更低部署和使用成本,得到更好效 果。图片来自通义千问官方博客。 (注:MoE 模型每次使用时只会激活部分参数,使用效率更高,所以有 总参数、激活参数两个参数指标。) Qwen3 发布前,我们访谈了阿里大模型研发一号位,阿里云 CTO 和通义实验室负责人,周靖人。他 也是阿里开源大模型的主要决策者。 迄今为止,Qwen 系列大模型已被累计下载 3 ...