训练

Search documents
海军航母编队赴远海开展实战化训练
news flash· 2025-06-10 09:38
Core Viewpoint - The Chinese Navy is conducting routine training exercises in the Western Pacific with the Liaoning and Shandong aircraft carrier groups to enhance their long-range defense and joint combat capabilities, in accordance with annual plans and international laws [1] Group 1 - The training aims to continuously improve the mission execution capabilities of the naval forces [1] - The exercises are described as regular and not targeting any specific country or objective [1] - The activities are aligned with relevant international laws and practices [1]
SOTA级视频编辑新方法:无需训练一句话编辑视频,背景保持100%
量子位· 2025-06-10 05:16
FlowDirector团队 投稿 量子位 | 公众号 QbitAI 传统的视频编辑工作流,正在被AI彻底重塑。 开销低:FlowDirector无反演过程,不需要存储任何额外的控制信息(如Attention Map),单卡4090就可实现高质量视频编辑。 支持广泛:除可进行传统的对象替换外,FlowDirector可以任意的添加、删除视频中的内容,以及进行一系列的纹理替换。 背景100%保持:通过对非编辑区域的"动力"进行冻结,使得编辑后的视频在无关区域与原视频完全保持一致。 方法:针对视频编辑中的「反演痛点」 现在的通用视频编辑方法大多基于反演-去噪(inversion-denosiong)范式: AI的视频编辑方法总是存在一些问题:例如视频运动不连贯、编辑后的视频产生意外变化等……经过分析,这些问题的产生最终大都指向同一 原因—— 反演-编辑范式 。 因此, 西湖大学AGILab 提出了一种全新的无需反演和训练的视频编辑新方法: FlowDirector 。 相较于其他视频编辑方法,FlowDirector有以下方面值得关注: 编辑结果展示: 这种范式带来了许多问题:反演过程中的错误会不断的累计,使得得 ...
AI展望:NewScaling,NewParadigm,NewTAM
HTSC· 2025-06-10 01:43
证券研究报告 科技 AI 展望:New Scaling,New Paradigm,New TAM 华泰研究 2025 年 6 月 10 日│中国内地 中期策略 全球 AI 展望:New Scaling,New Paradigm,New TAM 展望全球 AI 发展趋势,1)模型端新架构正逐步探索,预训练 Scaling Law 有望呈现新起点;2)算力端训练与推理共同推动算力需求持续上行,有望 开启新 TAM,同时算力硬件设计进入新范式;3)应用端商业模式变革带来 新范式,Agent 在细分领域率先落地带来新 TAM。持续看好 AI 产业投资主 线,看好全球 AI 应用进入业绩收获期。 模型:预训练 Scaling Law 有望开启新起点 回顾近三个季度以来的大模型迭代情况,强化学习(RL)带来的后训练 test-time compute 依然是大模型的主流迭代方向。经典 transformer 架构下 模型参数规模或已达到了瓶颈,人类现有公开数据已接近被使用完。但值得 注意的是科技巨头在预训练阶段仍在继续尝试,以腾讯混元 Turbo S 与 Gemini Diffusion 为代表的大模型开始尝试在架构上进 ...
RTX5090目前的市场行情
傅里叶的猫· 2025-06-08 12:28
自2025年1月NVIDIA RTX5090发布以来,大家就一直都很关注这个显卡,我们之前建了个5090的 群,一直到现在每天都是挺热闹。但在过去的几个月时间里,RTX5090也出现了一系列的问题,这 篇文章我们从售价、租金、算力、功耗、性能、发热和组网七个方面,结合实际案例与数据,深入 探讨RTX5090目前的市场行情,本文的数据参考自"小易AI袁亮"。 售价从高位回落 功耗 单卡租赁价格:约1万元/年。 整机配置价格:一台配备8张RTX5090的整机约为30万元。 RTX5090的功耗是其应用中的一大痛点。额定功耗:575W,峰值功耗:瞬间可高达900W,8卡整机 功耗:约6kW。 RTX5090发布时,市场对其寄予厚望,预期售价高达4万元以上。然而,仅4个月后,价格已跌至2万 元出头,部分电商平台(如京东)上的同德品牌RTX5090甚至低至2.3万元。价格快速下滑的原因主 要有以下几点: 首先,市场传言RTX5090存在芯片过热问题,影响了消费者信心。其次,早期关于多卡组网可能出 现"锁卡"或性能瓶颈的传闻,降低了企业采购意愿。此外,显卡厂商在发布初期大幅抬价,导致市 场需求不及预期。最后,上一代旗舰R ...
博通(AVGO):营收创单季历史新高,指引25Q3AI收入同比持续高增
CMS· 2025-06-06 15:11
证券研究报告|行业简评报告 2025 年 06 月 06 日 营收创单季历史新高,指引 25Q3 AI 收入同比持续高增 博通(AVGO.O)25Q2 跟踪报告 TMT 及中小盘/电子 事件: 博通(NASDAQ:AVGO)发布 FY2025Q2 季报,第二财季营收 150.04 亿美 元,同比+20%/环比+1%,毛利率为 79.4%,同比+3.2pcts/环比+0.3pct。综合 财报及交流会议信息,总结要点如下: 评论: 1、FY25Q2 营收创单季历史新高,毛利率超指引预期。 风险提示:竞争加剧风险、贸易摩擦风险、景气度变化风险、宏观形势风险。 推荐(维持) 行业规模 FY25Q2 营收 150.04 亿美元,创历史新高,同比+20%/环比+1%,超此前指引 (约 149 亿美元),收入增长得益于 AI 半导体业务的持续强劲以及 VMware 业 务的发展势头;毛利率 79.4%,同比+3.2pcts/环比+0.3pct,高于此前指引(约 78.9%)。库存 20 亿美元,环比增长 6%,库存周转天数 69 天。 2、AI 业务营收同比高增,软件受益 Vmware 增速明显。 1)半导体部门:收入为 ...
字节Seed新作:模型合并如何改变大模型预训练范式
机器之心· 2025-06-06 09:12AI Processing
当前时点如何看光模块反弹行情
2025-06-06 02:37
当前时点如何看光模块反弹行情 20250605 摘要 英伟达季报显示 Blackwell 产品占一季度收入 70%,部署速度达每周 1,000 架机架,预计二季度部署量超 6,000-10,000 架。GB300 可能 在二季度末出货,从 GB200 切换到 GB300 无太多障碍,采用有限创新 以保证稳健交付,核心变化包括 HBM 配置提升和标配 CX8 网卡。 Mellanox 网络业务超预期,MV link 销售额约 10 亿,ID 和以太坊贡献 10 亿环比增长。收入主要来自交换机、光模块、网卡及 Armlink 协议 授权,这些领域在第一季度有复苏迹象,利好英伟达供应链,如天孚通 信直接受益。 主权国家对 AI 投资超预期,沙特大单已促成,英伟达将在欧洲推动更多 主权 AI 大单。谷歌 IO 大会提到推理需求显著增加,每月 TOKEN 消耗 量达 480 万亿,同比增长 50 倍,支撑推理需求。 博通 Tomahawk 6 提前发布,加速行业迭代。Tomahawk 系列产品从 发布到批量出货通常需一到两年,预计 Tomahawk 6 将在 2026 年下 半年或 2027 年上半年开始规模交付,推动 ...
【马斯克:将于今年晚些时候上线Dojo 2】马斯克表示,Tesla Dojo AI训练计算机正在取得进展。我们将于今年晚些时候上线Dojo 2。一项新技术需要经历三次重大迭代才能走向卓越。Dojo 2已经很好了,但Dojo 3一定会更出色。
news flash· 2025-06-05 18:29
Core Viewpoint - Tesla is making progress with its Dojo AI training computer and plans to launch Dojo 2 later this year, indicating a commitment to advancing AI technology [1] Group 1 - The new technology, Dojo 2, has undergone significant iterations, with the expectation that it will improve further with Dojo 3 [1] - Elon Musk emphasizes that achieving excellence in technology typically requires three major iterations [1] - Dojo 2 is already performing well, setting a positive outlook for its successor, Dojo 3 [1]
一张卡干俩活,华为要把算力榨干
虎嗅APP· 2025-06-05 14:24
HUAWEI X HUXIU 三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的 「石器时代」中,为后世留下了变革的火种。 近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这 个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。 如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架 构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊 病,还能够降本增效,便于训练和部署。 AI之战远未终结,但正如在其他领域中「多快好省」的中国产业底色一样,大模型这棵生于 西方长于彼岸的科技树,也同样会被东方智慧经手后,进化为更加普适和亲切的工具。 近期,虎嗅将打造《华为技术披露集》系列内容,通过一连串的技术报告,首次全面披露相 关的技术细节。 希望本系列内容能为业界起到参考价值,也希望更多人能与华为一起,共同打造长期持续的 开放协作生态环境,让昇腾生态在中国茁壮成长。 《华为技术披露集》系列 VOL.11 :RL后训练 在大模型竞赛白热化的当下,「强化学习后训练」已成为突破LLM性能天花板的核 ...
RL后训练步入超节点时代!华为黑科技榨干算力,一张卡干俩活
21世纪经济报道· 2025-06-05 11:03
RL后训练已成为大模型性能突破的「杀手锏」,而算力浪费和集群效率低成为一大难题。这次, 华为团队祭出两大黑科技直接破局。不仅在CloudMatrix 384超节点实现MoE大模型训推共卡,资 源利用率翻倍,还打破了同步算法限制,让训练速度再提升50%。 在大模型竞赛白热化的当下,「强化学习后训练」已成为突破LLM性能天花板的核心路径。 爆火出圈的Op e nAI o 1、De e pSe e k -R1等模型,背后都是依靠RL后训练点石成金。 相较于预训练阶段的「广撒网」式知识获取,RL 后训练通过驱动模型与外部环境进行动态交 互,直接塑造了 LLM 在复杂任务中的推理效能。 当前, RL后训练阶段已经吃掉了训练全流程2 0%的算力,未来会飙升到5 0%,直接影响模 型的性能和成本。 在传统RL后训练中,训练和推理得排队干活,也就说大量算力都在「摸鱼」。 对此,华为团队拿出 「RL Fusi on训推共卡」 和 「St a l eSync 准异步并行」 两大黑科技, 把训练效率和资源利用率拉满。 · RL Fu si o n:让一张卡同时兼顾训练和推理两件事,资源利用率和吞吐翻倍。 · St a l eSy ...