a16解读AI数字人：技术基本Ready、应用层即将爆发，下一个十亿级赛道

文章转载自「RTE开发者社区」。过去几年，AI 已经能生成逼真的图片、视频和声音，悄然通过视觉和听觉的图灵测试。但 2025 年最令人激动的突破之一，毫无疑问将是把这些方案集于一体的 AI 数字人（Al Avatar）。结合 GPT-4o 吉卜力风格生成和 Hedra 制作的主播数字人，在 X 上获得了 231 万次观看。今年 2 月，字节跳动推出的 OmniHuman-1 模型在全球 AI 圈掀起了巨浪。仅需一张照片和一段音频，即可生成具有动态背景、支持全身动作，且口型同步的逼真 AI 视频。这些不再令人感到「恐怖」的 AI 角色，正以惊人的速度走出「恐怖谷」，并开始全面渗透到内容创作、广告营销、企业培训等多个领域。这不仅是人工智能技术的一次飞跃，更是内容产业的一次重要转变。近期，a16z 发布了关于 AI Avatar 数字人的最新报告，详细介绍了数字人的研究进展、构成要素以及未来发展应用。报告中，Agora、ElevenLabs、字节跳动的 OmniHuman 等技术被列为核心要素技术能力。报告预测：「底层模型的技术水平已经显著提升，AI 数字人应用层将迎来快速发展的机遇，我们预计该 ...