a16解读AI数字人:技术基本Ready、应用层即将爆发,下一个十亿级赛道
Founder Park·2025-04-11 17:40
文章转载自「RTE开发者社区」。 过去几年,AI 已经能生成逼真的图片、视频和声音,悄然通过视觉和听觉的图灵测试。但 2025 年最令人激动的突破之一,毫无疑问将是把这些方案 集于一体的 AI 数字人(Al Avatar)。 结合 GPT-4o 吉卜力风格生成和 Hedra 制作的主播数字人,在 X 上获得了 231 万次观看。 今年 2 月,字节跳动推出的 OmniHuman-1 模型在全球 AI 圈掀起了巨浪。仅需一张照片和一段音频,即可生成具有动态背景、支持全身动作,且口 型同步的逼真 AI 视频。 这些不再令人感到「恐怖」的 AI 角色,正以惊人的速度走出「恐怖谷」,并开始全面渗透到内容创作、广告营销、企业培训等多个领域。这不仅是 人工智能技术的一次飞跃,更是内容产业的一次重要转变。 近期,a16z 发布了关于 AI Avatar 数字人的最新报告,详细介绍了数字人的研究进展、构成要素以及未来发展应用。报告中,Agora、ElevenLabs、 字节跳动的 OmniHuman 等技术被列为核心要素技术能力。 报告预测:「底层模型的技术水平已经显著提升,AI 数字人应用层将迎来快速发展的机遇,我们预计该 ...