物理图灵测试

Search documents
英伟达Jim Fan深度分享:揭秘具身智能路线与障碍
3 6 Ke· 2025-05-14 02:23
机器人发展的"核动力"究竟是什么? 智东西5月13日报道,近日,英伟达AI总监兼杰出科学家、Project GR00T(人形机器人项目)与GEAR实验室联合负责人Jim Fan用17分钟时 间,在红杉AI Ascent大会上分享了他对具身智能领域未来面临的核心挑战和对应解法。 Jim Fan认为,大语言模型已突破传统图灵测试,但机器人在物理世界的表现仍远未达到人类水平,数据是这一过程中的最大瓶颈。机器人需 要的是物理交互的真实数据,而这些数据无法从网页抓取,只能靠人类手动采集,效率极低。 面对这一挑战,Jim Fan和英伟达团队希望在仿真世界中找寻解法。在超高速仿真打造的数字孪生中,机器人可在2小时内完成相当于现实世界 10年的训练量,再将知识无缝迁移到物理世界。3D生成、纹理生成等生成式AI技术,则将进一步降低仿真训练对人工数据的依赖。 当视频生成模型构建的虚拟世界逐渐成型,机器人将能够在无限可能的"梦境空间"中训练,无需依赖人工建模,不仅成本极低,还通过提示词 自由创造反事实的训练场景,进一步拓宽机器人的能力边界。 未来,世界模型与仿真技术的深度融合,将推动机器人技术进入"仿真2.0"时代,为具身智能发展 ...
腾讯研究院AI速递 20250512
腾讯研究院· 2025-05-11 14:17
生成式AI 一、 OpenAI强化微调终于上线,几十个样本可轻松打造AI专家 1. OpenAI正式发布RFT(强化微调)功能,通过思维链推理和专属评分机制,可用极少样本快 速提升模型在特定领域的专业表现; 2. RFT主要应用于三大场景:指令转代码、文本精华提取、复杂规则应用,已有ChipStack 等多家公司取得显著成效; 3. 实施RFT前必须创建评估体系,需要明确任务定义和强化评分方案,避免模棱两可的任务 目标。 https://mp.weixin.qq.com/s/c7RfeoWNwh3NZDeuTCXXLw 二、 Gemini 2.5实现视频理解重大突破:一口气处理6小时视频 1. Gemini 2.5 Pro突破视频处理长度限制,通过低媒体分辨率技术可处理长达6小时视频, 在多个学术基准测试中创下新纪录; 2. 实现视频内容与代码无缝结合,能将视频直接转化为交互式网页应用、p5.js动画等创新应 用形式; 3. 具备精准的视频片段检索和时序推理能力,可实现复杂场景计数、时间戳定位等高级分析 功能。 https://mp.weixin.qq.com/s/FkaOacVuVCS7wzny5l1jFQ ...