3D生成

Search documents
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
具身智能之心· 2025-06-18 10:41
作者丨 量子位 编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 CVPR 2025落下帷幕,这次关注度和社交参与感,非常深度了。 比如随手抓住一只何恺明,直接变成追星现场。 在以谷歌/Meta等国际巨头为主导的展区里,中国企业规模创纪录,像腾讯、字节等大展区里面人从众。 展台面前排队体验的技术Demo,妥妥都是技术风向标~ 每一年被CVPR接收的论文大家都会关注,因为它们一定代表着最最前沿的技术风向。尤其是获得了最佳论文奖项的成果,那就得好好拜读一 下。 如果你的论文能被CVPR接收,相当于受到非常大的认可。因此相关从业者一有机会都想冲一波,万一就被录用了呢。 总结下来,有这样几个有意思的发现。 首先, 多模态、3D生成 是此次论文接收和现场研讨的热门方向,尤其像3D生成是亮点,背后高斯泼溅技术成为此次论文标题出现次数最多 的前五关键词之一。 其次, 对于基础模型的讨论远比以往更加深入,并且延伸到了产业落地 。具身智能、机器人AI在Wo ...
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
量子位· 2025-06-17 07:41
白交 发自 凹非寺 量子位 | 公众号 QbitAI CVPR 2025落下帷幕,这次关注度和社交参与感,非常深度了。 比如随手抓住一只何恺明,直接变成追星现场。 在以谷歌/Meta等国际巨头为主导的展区里,中国企业规模创纪录,像腾讯、字节等大展区里面人从众。 总结下来,有这样几个有意思的发现。 展台面前排队体验的技术Demo,妥妥都是技术风向标~ 首先, 多模态、3D生成 是此次论文接收和现场研讨的热门方向,尤其像3D生成是亮点,背后高斯泼溅技术成为此次论文标题出现次数最多 的前五关键词之一。 其次, 对于基础模型的讨论远比以往更加深入,并且延伸到了产业落地 。具身智能、机器人AI在Workshop议程设置中独立出来一个大的板 块。 最后,中国企业今年参与得很深度,不过目前还是聚焦在已经成熟商业化的大公司。 多模态成为接收论文标题中的高频词,3D发展速度快、成果亮眼。 有热心网友整理了2878篇论文标题,得出了以下高频词。 除此之外还有哪些亮点,现在就带大家一网打尽。 探展CVPR 2025 CVPR含金量提升 CVPR,视觉领域妥妥的顶会,甚至与其他两位并称的顶会ICCV和ECCV相比,名气还要高那么一点 ...
腾讯开源混元3D 2.1大模型 开发门槛大大降低
Guang Zhou Ri Bao· 2025-06-14 14:17
据悉,目前,混元3D模型在Hugging Face(知名的开源社区和技术平台)下载量已超过180万。在此基础上,混元3D 2.1模型进一步升级并继续开源。 在效果层面,从平台一张上传的首饰盒图片可见,模型生成的3D首饰盒,纹理清晰,质感细腻,光影保持一致性。 相较于混元3D 2.0模型,新模型既优化了几何生成的质量,也开放了PBR(基于物理的渲染)材质生成大模型,进一步提升3D资产的质感和光影表现,告 别"塑料感"。 腾讯混元大模型迎来重要升级。6月14日,据腾讯公众号消息,在CVPR2025(计算机视觉领域顶会之一)上,腾讯公布混元3D 2.1大模型对外开源,这是 首个全链路开源的工业级3D生成大模型,达到了行业领先水平。 混元3D模型生成的首饰盒效果游戏里的角色、电影中的道具、线上商城的产品模型,都用新模型可以生成3D版。 腾讯方面表示,除了效果全面升级,混元3D 2.1模型开发门槛也降低了。该模型从模型权重、训练代码,到数据处理流程上全链路开源。这对于开发者而 言,可以自由地进行微调、二次训练或优化,满足各种定制化需求,也为学术研究提供了平台。同时,混元3D 2.1模型适配于消费级显卡,在个人电脑也 能 ...
腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
量子位· 2025-06-13 16:44
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚的CVPR上,鹅厂3D生成模型 混元3D 2.1 正式宣布开源! 它可以紧跟潮流,细腻地呈现出当红炸子鸡Labubu。 主打几何与纹理双优化 如开头所述,混元3D 2.1主打的是 几何与纹理的双重优化 。 几何决定了建立出的模型在形状上的精度,纹理则还原模型表面的颜色、光泽和细节表现。 也可以走复古路线,生成纹理精致的青铜器。 总之相比于前一代2.0,混元3D 2.1主打的是 几何与纹理 的双重优化。 特别在纹理贴面上有比较大的优化,可达到当前开源3D模型中的SOTA。 比如这个金属质地的葡萄型摆件,2.1和之前2.0的质感和光泽对比非常明显: 并且混元3D 2.1的 训练代码、模型权重、数据处理流程全部开源 ,支持一键部署,开发者还可以自主精调。 据腾讯介绍,这是首个全链路开源的工业级3D生成大模型,并且达到了闭源级水平,同时还 可适配消费级显卡 。 混元3D 2.1 可生成基础颜色、金属度、粗糙度等指标各不相同的贴图,同时还支持皮革、木质、金属、陶瓷等多种复杂材质的高质量渲染。 比如这组青花瓷制成的小船,可以看到右侧2.1版本生成的结果光泽更 ...
3D大模型公司VAST再获数千万美元融资 全球首个AI 3D工作台Tripo Studio:从 “算法领先” 到 “工作流闭环”
智通财经网· 2025-06-11 10:52
智通财经APP获悉,3D大模型公司VAST再次完成数千万美元的Pre-A+轮融资。本轮投资由北京市人工 智能产业投资基金领投,靖亚资本跟投。VAST此前投资股东包括绿洲资本、达晨财智、春华创投、英 诺天使基金、水木清华校友种子基金等。 同时,VAST正式发布了全球首个AI驱动的一站式3D工作台Tripo Studio,并即将推出全新算法Tripo 3.0。融资将重点投入Tripo系列大模型研发及Tripo Studio产品及生态平台建设,加速构建「AI+3D」全 产业链条,打造"基础模型 + 生态插件 + 原生工作台"的端到端产品体系,从而构建覆盖专业级(PGC 生 产者)、达人级(PUGC 创作者)到大众级(UGC 用户)的创作者画像完整梯度,进一步巩固团队在3D生成 领域的全球领先地位。 VAST成立于2023年3月,是一家专注于通用3D大模型研发的AI公司,致力于通过打造大众级3D内容创 作工具建立3D UGC内容平台,使基于3D的空间成为用户体验升级、内容表达创新和新质生产力提升的 核心要素。 自2024年初起,VAST持续迭代Tripo大模型,先后推出Tripo1.0至Tripo2.5等数十亿参数规 ...
VAST完成数千万美元新融资,他说模型即产品不是真正的产品
暗涌Waves· 2025-06-10 04:57
「 新路径。 」 文 | 施嘉翔 "那真正的目标用户群体是谁?"宋亚宸的答案是和程序员很像——他们同样需要一个"像Cursor"一样的AI原生3D工作台,重 塑传统的制作流程。 基于此,VAST在上个月发布了AI驱动的一站式3D工作台Tripo Studio,不再只是生成一个80分的模型,而是提供完整的AI工 作流,让创作者几分钟内将模型优化到95分。 与此同时,VAST在探索当下AI 3D原生可实现且可被消费的内容范式 ,理解什么强交互的轻内容是好玩的,他们和独立开发 者共同探索3D类的小游戏,为《燕云十六声》中的亮点玩法"万物太极"制作了"Tripo"闪电版,让玩家在虚拟世界里实现言出 法随。 这方面的探索也一定程度源于宋亚宸对游戏狂热。还在商汤时,他就从零到一落地了AI+游戏和AI+动画的业务。作为"被电子 海洛因投毒"的95后一代,上次见面时,宋亚宸说自己每天凌晨2、3点才睡觉,他白天是VAST的CEO,晚上兼任着《率土之 滨》里公会的会长。 这次接受采访,他说自己有段时间没玩《率土之滨》了,"因为出来了不少新的SLG",最近还沉迷于《罗马》和《大江湖之苍 龙与白鹤》,每周末争取玩上一局《龙与地下城》 ...
对话 VAST 宋亚宸:3D 关乎全人类幸福,也关乎我的
晚点LatePost· 2025-06-10 01:48
文 丨 邱豪 编辑 丨 宋玮 据我们了解,AI 3D 生成模型公司 VAST 近期完成数千万美元 Pre A+ 轮融资,由北京市人工智能产 业投资基金领投,靖亚资本跟投。VAST 此前投资股东包括绿洲资本、达晨财智、春华创投、英诺天 使基金、水木清华校友种子基金等。 VAST 成立于 2023 年 3 月,最早有声量是当年 10 月在 GitHub 上线的开源项目 Wonder 3D,可以根 据单张 2D 图片生成 3D 模型,3 个月内获得近 4000 颗星。次年 2 月,VAST 上线了第一个产品 Tripo,可以同时用文字描述和图像来生成 3D 模型。 如今,VAST 已正式发布全球首个 AI 3D 工作台 Tripo Studio,系列模型 Tripo 也即将更新至 3.0 版 本。根据公司介绍,二者搭配可将 3D 建模从人工时代的 15 小时缩短至 6 分钟。 VAST 创始人宋亚宸是个非典型的 AI 创业者,1997 年出生的他身材高大,鬓角微白,跟人交谈时笑 声爽朗,语气自信而张扬。 很难在同一个人身上见到这么多矛盾特征:一个中二、热血的动漫迷,熟读历史、钻研宗教和神学; 一个喜欢打游戏的宅男, ...
速递|破解3D生成取代CAD?SpAItial获1300万美金种子资金,前Synthesia联创集结Meta谷歌豪华技术团队
Z Potentials· 2025-05-28 02:43
图片来源: SpAItial 从 OpenAI 的 4o 到 Stable Diffusion ,能够根据文本提示生成逼真图像的 AI 基础模型如今已比比皆 是。 相比之下,能够仅凭文本提示就生成完整、连贯的 3D 在线环境的基础模型才刚刚崭露头角。 不过,这些模型何时会普及只是时间问题。如今,欧洲最杰出的 AI 3D 模型研究者之一、慕尼黑工业 大学视觉计算与 AI 实验室的马蒂亚斯·尼斯纳( Matthias Niessner )已申请创业休假,创立了一家该 领域的初创公司: SpAItial 。 尼斯纳曾是 AI 虚拟形象公司 Synthesia ( 估值 21 亿美元 )的联合创始人,此次他为这家欧洲初创 企业筹集了 1300 万美元的超大额种子轮融资。 目前尚未有人真正摸清对照片级真实感 3D 环境的市场需求规模。从数字孪生到增强现实,这个号称 " 万亿美元 " 的机遇足以让风投们兴奋,但其模糊性和多面性也使得市场进入策略难以厘清。 最显而易见的应用场景是电子游戏开发,不过这类模型还能应用于娱乐产业、建筑领域的 3D 可视 化,最终或将拓展至机器人训练等现实世界应用场景。 领投方是欧洲知名早期投资机 ...
阶跃星辰×光影焕像联合打造超强3D生成引擎Step1X-3D!还开源全链路训练代码
机器之心· 2025-05-16 02:42
阶跃星辰携手光影焕像发布并开源 3D 大模型 ——Step1X-3D。Step1X-3D 模型总参数量达 4.8B(几何模块 1.3B,纹理模块 3.5B),凭借坚实的数据基础与先进的 3D 原生架构,可生成 高保真、可控 的 3D 内容。 Step1X-3D 不止于视觉「 好看」,更追求实现「好用」与「可控」 ,旨在为 3D 内容创作提供强大而可靠的技术引擎。这款模型可以广泛应用在游戏娱乐、影视 与动画制作、工业制造与设计等各种场景。 Step1X-3D 公布了完整的数据清洗策略,数据预处理策略,以及 800K 高质量的 3D 资产,3D VAE、3D Geometry Diffusion 以及 Texture Diffusion 的全链路训练代 码开源,助力 3D 生成社区发展。 欢迎大家上手体验: Online Demo(立即体验):https://huggingface.co/spaces/stepfun-ai/Step1X-3D 核心特性与技术支撑 Step1X-3D 尝试解决 3D 内容生成的关键挑战,在数据、生成质量与可控性上进行了创新实践。 1. 数据驱动与算法协同优化 好数据是好模型的基础。 ...
深度|具身合成数据的路线之争,谁将率先走出困境?
Z Potentials· 2025-04-08 12:30
" 没有数据,就创造数据。 "NVIDIA Cosmos World Foundation Models, CES 2025 NVIDIA Cosmos World Foundation Models, CES 2025 摘要 本文主要描述了具身合成数据两条主要技术路线之争: " 视频合成 +3D 重建 " or " 端到端 3D 生成 " 。参考自动驾驶的成功经验,前者模态转换链路过长 导致误差累积, ' 直接合成 3D 数据 ' 理论上有信息效率优势,但需要克服 " 常识欠缺 " 等挑战。 眼下,机器人流行视频中高难度动作(空翻、跳舞、格斗等)主要依靠 遥控 / 预设编程完成的。 机器人 逐渐完善了 自身运动控制能力 ,然而对外环境感 知、推理能力有待完善。 数据是 AI 时代的石油。具身智能的突破高度依赖于数据驱动的训练。由于现实数据采集成本高,合成数据被推上了前台。它不只是 " 虚拟的替代品 " ,更 可能是具身智能迈向通用能力的关键推动力。英伟达在 CES 2025 指出 " 尚无互联网规模的机器人数据 " ,自动驾驶已具备城市级仿真,但家庭等复杂室内 环境缺乏 3D 合成平台。 为解决 " 常识欠 ...