3D生成「ImageNet」来了!腾讯混元开源HY3D-Bench
TENCENTTENCENT(HK:00700) 量子位·2026-02-06 10:10

腾讯混元团队 投稿 量子位 | 公众号 QbitAI 3D生成如今在可用性上已经达到了一眼惊艳的程度。 但数据质量参差、评估标准缺失、长尾类别覆盖不足这三大痛点,依然困扰着该领域的研究者们。 该工作通过自动化数据清洗流水线,从Objaverse等大规模原始库中筛选并处理了 25.2万 个高质量3D资产,提供包括水密网格、多视角渲染 图像在内的"即用型"数据集,同时还包含 24万 个3D部件分解结果,显著降低了3D生成模型的训练门槛。 另外,为补充学术数据集多样性不足,创新性地引入AIGC驱动合成管道,利用LLM生成语义描述、扩散模型生成图像,并通过HY3D-3.0引 擎转化为高保真3D资产,均匀覆盖了1252个类别,平衡了常见类别和长尾类别数据分布的差异。 实验显示,基于该基准的轻量级模型(Hunyuan3D-2.1-Small)在生成质量和推理速度上均优于传统方法,该数据集为机器人仿真、虚拟现 实等下游应用提供了坚实的数据基石。 数据集组成 高质量基准数据集的可用性始终是3D生成模型发展的核心制约因素。早期基准数据集如ShapeNet虽为3D生成研究奠定基础,但存在 类别覆 盖失衡、几何结构简单、数据量不足 ...