3D AIGC

Search documents
AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!国产交互式世界模型来了
量子位· 2025-05-13 03:01
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 用 AI无限扩展《我的世界》 ,动动鼠标、键盘即可搞定! 一直前进、砍掉树木,后面别有洞天的世界,都是由用户与环境交互、AI实时生成的。 也就是说,在砍掉树木之前,树后面的内容还是不存在的。 用鼠标切换视角、环顾环境,丝滑生成连贯画面内容。 哪怕是跳跃,画面也非常稳定,且符合自然世界物理规律。 Minecraft中森林、沙滩、沙漠、冰川、河流、平原等场景都可搞定。 支持基础运动(前后左右)、复合运动、视角移动、跳跃、攻击等细节操作。 而且不局限于《我的世界》, 类Unreal Engine场景泛化 也不在话下。 生成的雨天后的街道,已经非常逼真。 无限逼近画面细节也不崩: 以上,就是 交互式世界模型 最新的重大更新! Matrix-Game ,面向游戏世界建模,专为开放世界生成高质量内容而来。 它 由 昆仑万维 带来,可以让用户通过简单的键鼠指令,自由探索、创作细节丰富且符合现实世界物理规律的虚拟内容; 以 极 低 操作 门 槛, 释放 物理 真实 感 与 创作 自由 度 的 双重 潜力。 要知道,传统方法构建类似效果,往往需要手写代码、渲染视觉效果,耗时 ...
速递|全球首个多模态交互3D大模型来了,GPT-4o都没做到的,它做到了
Z Potentials· 2025-04-14 02:30
在更具挑战性的 3D AIGC 领域, DreamTech 近期推出 Neural4D 2o 多模态大模型, 支持文本及图像输入,实现基于自然语言的交互编辑, 这是全球首个 支持多模态交互的 3D 大模型。 Neural4D 2o 通过文本、图像、 3D 、 motion 等联合训练多模态 transformer encoder 及 3D DiT decoder , 在一个大模型中实现了 3D 生成的上下文一致 性、高精准局部编辑、角色 ID 保持、换装、风格迁移等能力。 此外, Neural4D 2o 也提供了 MCP 协议的支持,部署了 Neural4D Agent(alpha ),帮助用 户更加便捷、高质量地完成 3D 内容创作。 实测效果: 我们上传一张图。 输入 prompt:"保持他的长相、表情和穿着,生成一个全身的Q版形象。" 前些天, GPT-4o的多模态生图上线之后,引发全球AI社区广泛的关注,吉卜力图画全网风靡。 GPT-4o 采用联合文本、图像、语音和视频进行训练,在一个大模型中同时支持了文本、图像、语音等多个模态, 而且其 高度可控,在特征保持,上下文 理解等重要功能使图像生成进入到了 ...