从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

机器之心发布 还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗?现在,它迎来了史诗级进化! 近日,快手可灵团队正式发布了 KlingAvatar2.0 技术报告,这一次,数字人不仅能 "表演",更能 "生动表达"—— 它们将拥有更丰富的情感层次、更精准 的多角色互动,对复杂文本指令的深度理解能力,以及支持长达 5 分钟的视频生成。 目前该模型已经在可灵平台全量上线,人人都可体验! 首先看一下效果,肢体灵动、表情逼真,生动性拉满! 让我们拆解技术报告,看一下可灵团队是如何实现如此生动效果的。 核心技术突破:让数字人 "活" 起来的三大创新 1. 时空级联框架:长视频不再 "虎头蛇尾" 想象一下,你正在制作一个 5 分钟的产品介绍视频,但传统的 AI 生成工具总是在第 2 分钟后就开始 "崩坏"—— 画面变得模糊,人物动作开始不连贯,甚 至连口型都对不上了。KlingAvatar2.0 创新性地提出了 时空级联框架: 论文地址:https://arxiv.org/pdf/2512.13313 体验链接:https://app.klingai.com/cn/ai-human/image/ ...