DreamZero
Search documents
腾讯研究院AI速递 20260210
腾讯研究院· 2026-02-09 16:03
https://mp.weixin.qq.com/s/vPp0aFcc1QJZ2l0D4qFH8A 二、小红书内测AI视频剪辑应用OpenStoryline,对话驱动 生成式AI 一、 实 测 神秘模型Pony Alpha,Opus级智能 , 架构师思维 1. Pony Alpha在OpenRouter走红,无发布会无论文,却凭超强编程能力引发开发者圈热议,有人连续编程3小时做 出可玩的Pokemon Ruby; 2. 实测表现惊艳,能从零复刻《星露谷物语》,自主完成需求分析、架构设计到功能实现全流程,展现出系统级工程 理解与长时间推理能力; 3. 模型身世成谜,有人猜测是Anthropic Sonnet 5、DeepSeek-V4或智谱GLM-5,若为国内厂商作品,意味着国 产模型在高阶编程领域已进入新阶段。 1. 小红书正在研发AI视频剪辑应用OpenStoryline,采用"非线性编辑+对话驱动"模式,用户上传图片通过自然语言 即可完成视频剪辑; 2. 技术上采用DeepSeek和Qwen 3开源模型,结合小红书自有的dots.lm文本大模型和FireRedASR音频模型实现生 态适配; 3. 小红书近 ...
英伟达世界模型再进化,一个模型驱动所有机器人!机器人的GPT时刻真正到来
机器之心· 2026-02-09 01:18
驱动具身智能进入通用领域最大的问题在哪里? 我们认为,核心问题在于 「跨具 身(cross-em bodiment)迁移」 。 当然,具身智能执行通用复杂任务的核心是一个完善的世界模型。但是,大多世界模型其实并没有我们想象的那样具备极强的泛化性和迁移能力。 简单来说,这些用在机器人或是智能汽车上的世界模型,基本都是在某个固定的硬件平台上设计训练的,大多不具备很强的泛化能力,跨具身迁移几乎靠运气。 说白了,大多数机器人今天学到的不是 「世界是如何运作的」,而是 「在这台机器该怎么动」。我们需要能学到一个真正理解物理与因果的世界模型 —— 知道 世界会怎么变、动作会带来什么后果,才能在不同身体、不同环境中迁移与泛化。 在这个问题上,作为算力的王者,深耕各类世界模型的英伟达再一次发力,构建了一个全新是世界模型,一切都是 Zero-Shot 的。 最近, 英伟达 GEAR 实验室提出 DreamZero , 一种 基于预训练视频扩散骨干网络构建 的世界动作模型(WAM) 。 这是一个拥有 140 亿参数的模型,能够让机器人仅通过简单的文本提示就完成此前从未见过的任务。 实验室负责人 Jim Fan 将其称为机器人领域 ...