Wan2.1

Search documents
EasyCache:无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案
机器之心· 2025-07-12 04:50
论文作者团队简介:本文第一作者周鑫,共同第一作者梁定康,均为华中科技大学博士生,导师为白翔教授。合作者包括华中科技大学陈楷锦、冯天瑞、林鸿 凯,旷视科技陈习武、丁宜康、谭飞杨和香港大学赵恒爽助理教授。 在 HunyuanVideo 上, EasyCache 在复杂场景下保持与原视频的一致外观,同时显著加速 1. 研究背景与动机 近年来,随着扩散模型(Diffusion Models)和扩散 Transformer(DiT)在视频生成领域的广泛应用,AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型,已经能够生成结构清晰、细节丰富且高度连贯的长视频内容,为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变 革。 但与此同时,推理慢、算力消耗高的问题也日益突出。以 HunyuanVideo 为例,生成一个 5 秒、720P 分辨率的视频,单次推理在单张 H20 上需要 2 小时。这种高 昂的资源代价,极大限制了扩散视频生成技术在实时互动、移动端和大规模生产场景的应用落地。 造成这一瓶颈的核心原因,是扩散模型在生成过程中需要多次迭代去噪,每一步都要进 ...
无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention
机器之心· 2025-06-28 04:35
本文第一作者为美国东北大学博士生沈轩,研究方向为高效人工智能,致力于在 GPU、移动端、FPGA 和 ASIC 等多种硬件平台上实现大模型的高效部署与加 速。第二作者为香港中文大学的韩晨夏,研究方向聚焦于计算机体系结构与 AI 系统的高效化设计。 在高质量视频生成任务中,扩散模型(Diffusion Models)已经成为主流。然而,随着视频长度和分辨率的提升,Diffusion Transformer(DiT)模型中的注意力机制 计算量急剧增加,成为推理效率的最大瓶颈。这是因为在视频生成中,DiT 通常使用 3D 全局注意力来建模时空一致性, 虽然效果出色,但计算量会随着 token 数 量呈平方增长 ,带来了巨大的计算负担。在 HunyuanVideo 等视频生成模型中,注意力模块计算时间占比超过 80%,生成仅 8 秒的 720p 视频甚至需要接近一小时 的时间。因此,提升视频生成模型的生成速度成为了迫切的需求。 现有视频生成加速方法,如 Sparse VideoGen(https://arxiv.org/abs/2502.01776)和 AdaSpa(https://arxiv.org/abs/250 ...
AI周度跟踪2025年第7期:国内外AI投入力度不减,AI浪潮势能充足
Orient Securities· 2025-05-22 13:30
传媒行业 行业研究 | 动态跟踪 国内外 AI 投入力度不减,AI 浪潮势能充足 ——AI 周度跟踪 2025 年第 7 期 核心观点 投资建议与投资标的 ⚫ 看好 AI 新周期带动算力-算法-应用生态三端依次持续推进,我们建议增加港股互联 网板块配置仓位,核心推荐处于产业链前端,云消费弹性明显+基模实力领先+算法 具备优势的阿里巴巴-W(09988,买入),多模态视频生成模型技术全球领先,商业 化变现节奏加快的快手-W(01024,买入),卡位最佳社交场景,具备数据+应用生 态优势的腾讯控股(00700,买入),以及加速完善 AI 基模和应用布局,AI 搜索领先 的百度集团-SW(09888,买入)。 风险提示 行业发展及 AI 应用落地不及预期,宏观经济风险,海外政策风险。 国家/地区 中国 行业 传媒行业 报告发布日期 2025 年 05 月 22 日 | 项雯倩 | 021-63325888*6128 xiangwenqian@orientsec.com.cn | | --- | --- | | | 执业证书编号:S0860517020003 | | | 香港证监会牌照:BQP120 | | 李雨琪 ...
AI周度跟踪2025年第7期:国内外AI投入力度不减,AI浪潮势能充足-20250522
Orient Securities· 2025-05-22 11:50
传媒行业 行业研究 | 动态跟踪 国内外 AI 投入力度不减,AI 浪潮势能充足 ——AI 周度跟踪 2025 年第 7 期 核心观点 投资建议与投资标的 ⚫ 看好 AI 新周期带动算力-算法-应用生态三端依次持续推进,我们建议增加港股互联 网板块配置仓位,核心推荐处于产业链前端,云消费弹性明显+基模实力领先+算法 具备优势的阿里巴巴-W(09988,买入),多模态视频生成模型技术全球领先,商业 化变现节奏加快的快手-W(01024,买入),卡位最佳社交场景,具备数据+应用生 态优势的腾讯控股(00700,买入),以及加速完善 AI 基模和应用布局,AI 搜索领先 的百度集团-SW(09888,买入)。 风险提示 行业发展及 AI 应用落地不及预期,宏观经济风险,海外政策风险。 国家/地区 中国 行业 传媒行业 报告发布日期 2025 年 05 月 22 日 | 项雯倩 | 021-63325888*6128 xiangwenqian@orientsec.com.cn | | --- | --- | | | 执业证书编号:S0860517020003 | | | 香港证监会牌照:BQP120 | | 李雨琪 ...
【产业互联网周报】美国商务部撤销拜登时代AI扩散规定;英伟达将调整对华芯片出口,不再基于Hopper;微软裁员3%,减少中层管理人员
Tai Mei Ti A P P· 2025-05-21 00:54
阿里巴巴正式开源通义万相Wan2.1-VACE,这是一款支持视频生成与编辑的模型,单一模型可同时支持 文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基 础生成和编辑能力。本次共开源1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行。 卫龙美味:引入字节跳动旗下飞书作为全员协作沟通平台 图片系AI生成 【产业互联网周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的企业级服务、云计算、 大数据领域的前沿趋势、重磅政策及行研报告。】 国内资讯Manus开放注册,用户每天可免费执行一项任务 价格曾经炒到10万,一码难求的AI智能体平台Manus宣布开放注册,Manus在公告中表示,Manus向所 有人开放,无需等待名单;所有用户每天可免费执行一项任务(300积分),所有用户一次性获得1000 积分奖励。 阿里巴巴开源视频生成与编辑模型通义万相Wan2.1-VACE 中国休闲食品企业卫龙美味(09985.HK)宣布:引入字节跳动旗下飞书作为全员协作沟通平台。卫龙美味 表示,未来将通过飞书的数字化能力,提升组织效率并布局 AI 生产力。卫龙美味副董事长兼CE ...
关注海外资产的季报变化
SINOLINK SECURITIES· 2025-05-19 03:35
本周观点 关注海外资产的季报变化: 投资逻辑 持续关注中美关税谈判,关注海外资产一季报的变化。因关税贸易战引发(包括担心中概退市)的海外中国资产 跌幅陆续得到填补,挖掘超跌板块或个股的难度增加。建议关注:1)美股中概资产:对交易平台资产的推荐不 变,但短期暂无新增催化或者增量逻辑;保持对咖啡龙头的长期看好;保持关注跌出深度价值的个股;2)港股 互联网资产:关注追求确定性的优质互联网平台、外卖平台竞争情况。3)港股消费类资产:咖啡茶饮板块关注 咖啡龙头,同时关注将 IPO 的消费类公司。4)其他:建议关注困境反转标的,及互金助贷板块。5)传媒:建议 关注重组逻辑的个股机会。个股:拼多多、贝壳、分众传媒、芒果超媒。 风险提示 后续政策不及预期风险;中美关系变化风险;内容上线及表现不及预期风险;宏观经济运行不及预期风险;AI 技 术迭代和应用不及预期风险;政策监管风险 敬请参阅最后一页特别声明 教育:上周在线教育公司高途/有道发布财报,收入收款保持较好增长的同时,盈利能力有所提升。结合近期财 报看,K12 教培行业景气良好,非学科课程续班率提升,继续看好龙头公司转型后持续扩大市场份额。 奢侈品:上周历峰集团发布财报 ...
TMT行业周报(5月第3周):国内两大云厂商大资本同比增长-20250519
Century Securities· 2025-05-19 02:01
[Table_ReportDate] 2025 年 05 月 19 日 [Table_Author] 分析师:李时樟 执业证书:S1030522060001 电话:18065826333 邮箱:lisz@csco.com.cn 分析师:罗晴 执业证书:S1030524110001 电话:13603091122 邮箱:luoqing@csco.com.cn 公司具备证券投资咨询业务资格 证券研究报告 TMT [Table_Title] 国内两大云厂商大资本同比增长 TMT 行业周报(5 月第 3 周) [Table_S 行业观点: ummary] 请务必阅读文后重要声明及免责条款 [Table_Industry] [Table_ReportType] [Table_BaseData] 1) 周度市场回顾。TMT 板块内一级行业上周(5/12-5/16)涨跌 幅为:通信(-0.12%)、电子(-0.75%)、传媒(-0.77%)、 计算机(-1.26%),TMT 板块整体跑输沪深 300(1.12%)。TMT 板块内涨幅靠前的三级子行业分别为品牌消费电子(1.95%)、 通信网络设备及器件(1.16%)、消费电子 ...
关注海外资产的季报变化,及传媒重组主线
SINOLINK SECURITIES· 2025-05-18 14:51
本周观点 关注海外资产的季报变化: 投资逻辑 持续关注中美关税谈判,关注海外资产一季报的变化。因关税贸易战引发(包括担心中概退市)的海外中国资产 跌幅陆续得到填补,挖掘超跌板块或个股的难度增加。建议关注:1)美股中概资产:对交易平台资产的推荐不 变,但短期暂无新增催化或者增量逻辑;保持对咖啡龙头的长期看好;保持关注跌出深度价值的个股;2)港股 互联网资产:关注追求确定性的优质互联网平台、外卖平台竞争情况。3)港股消费类资产:咖啡茶饮板块关注 咖啡龙头,同时关注将 IPO 的消费类公司。4)其他:建议关注困境反转标的,及互金助贷板块。5)传媒:建议 关注重组逻辑的个股机会。个股:拼多多、贝壳、分众传媒、芒果超媒。 风险提示 后续政策不及预期风险;中美关系变化风险;内容上线及表现不及预期风险;宏观经济运行不及预期风险;AI 技 术迭代和应用不及预期风险;政策监管风险 敬请参阅最后一页特别声明 1 教育:上周在线教育公司高途/有道发布财报,收入收款保持较好增长的同时,盈利能力有所提升。结合近期财 报看,K12 教培行业景气良好,非学科课程续班率提升,继续看好龙头公司转型后持续扩大市场份额。 奢侈品:上周历峰集团发布 ...
阿里开源全能视频模型,腾讯发布混元图像2.0模型
GOLDEN SUN SECURITIES· 2025-05-18 09:43
证券研究报告 | 行业周报 gszqdatemark 2025 05 18 年 月 日 传媒 阿里开源全能视频模型,腾讯发布混元图像 2.0 模型 行情概览:本周(5.12-5.16)中信一级传媒板块下跌 0.67%。本周传媒板 块受市场影响下跌。2025 年传媒弹性方向看好 AI 应用、IP 变现及并购重组, AI 应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪,重点关注多模 态产业方向。IP 变现聚焦有 IP 优势及全产业链潜力的公司,潮流玩具、影视 内容等方向有机会。并购重组重点关注国企方向,在国资委明确国企市值考核 的背景下,传媒国企诉求明显提升,部分国企资金优势明显。 板块观点与关注标的:1)资源整合预期:中视传媒、国新文化、广西广电、 唐德影视、吉视传媒、游族网络等;2)AI:荣信文化、奥飞娱乐、汤姆猫、 盛天网络、中文在线、易点天下、视觉中国、盛通股份、焦点科技、豆神教育、 世纪天鸿、佳发教育等;3)游戏:建议关注确定性强的神州泰岳、恺英网络、 巨人网络、吉比特,关注完美世界、ST 华通、冰川网络、华立科技;4)国企: 慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育、大晟文化等;5)教 育 ...
全球科技行业周报:国内多模态大模型相继迭代,算力仍为计算机长期主题
Huaan Securities· 2025-05-18 07:50
[Table_IndNameRptType] 全球科技 行业周报 国内多模态大模型相继迭代,算力仍为计算机长期主题 [Table_IndRank] 行业评级:增持 报告日期: 2025-05-17 行业指数与沪深 300 走势比较 分析师:来祚豪 执业证书号:S0010524100001 邮箱:laizh@hazq.com 分析师:金荣 执业证书号:S0010521080002 邮箱:jinrong@hazq.com 分析师:刘京松 执业证书号:S0010524090001 邮箱 :liujs@hazq.com 相关报告 ·行业点评:海内外 AI 发展势头强 劲,关注港股互联网反弹机会 2024-05 -07 ·公司点评:特斯拉 25Q1 点评:利润 低于预期,新车将于上半年推出 2025- 04-30 ·公司点评:谷歌 25Q1 点评:利润超 预期,全年 CapEx 维持 750 亿美元 202 5-04-30 ·公司点评:台积电 25Q1 点评:AI 需 求驱动业绩增长,25Q2 指引超预期 Opt imus2025-04-28 5 月 16 日,腾讯发布最新混元图像 2.0 模型(Hunyuan Ima ...