Workflow
混元3D世界模型1.0 lite版本发布,消费级显卡就能跑
TENCENTTENCENT(HK:00700) 量子位·2025-08-15 10:05

闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 以上,均是腾讯混元3D世界生成模型HunyuanWorld 1.0在 消费级显卡 上跑出来的—— 发布即 开源 ,还可兼容传统CG管线,低门槛操作但高质量生成。 只需要一句话或一张图片,就能生成360度全景3D世界。 还支持沉浸式漫游。 与最近爆火的Genie3只能生成视频不同,该模型还可以导出能进行二次编辑的3D mesh。 下面咱们边看效果边说技术。 分层实现3D生成,量化降低显存开销 HunyuanWorld 1.0技术框架的核心是 以全景图为桥梁,分层实现3D生成 ,通过借助2D生成技术的多样性做出丰富场景,再基于全景图实 现3D生成的连贯性。 场景生成的关键流程可以概括为三步: 首先根据文字或图片输入,生成无边界断裂、无几何变形的360°全景图。 分层场景生成 接着 将全景图拆分为天空、背景、前景物体 等可独立操作的语义图层。 最后为各图层标注合理深度,再按图层特性分别转化为3D结构,同时支持导出标准3D模型。 在此基础上,框架还做了两项实用优化:一是通过 点云缓存与视频扩散技术 ,实现长距离场景的无缝漫游; 二是针对3D模型的在线/离线双模式压 ...