Workflow
腾讯研究院AI速递 20250903

生成式AI 一、 这次真不一样,谷歌Gemini解锁「详解网页」新技能 1. 谷歌Gemini API全面上线"URL Context"功能,使模型能深度访问并处理来自URL的内容,包括网页、PDF和图 像等; 2. 该功能采用两步检索流程,可深度解析PDF中的表格、文本结构、脚注等,处理容量上限达34MB,单次请求最多 处理20个URL; 3. URL Context被评价为"RAG的又一颗棺材钉",无需提取、分块、矢量化和存储等繁琐流程,直接解析特斯拉50 页PDF并精准提取数据。 https://mp.weixin.qq.com/s/alV-czwScS_CSsdP3nWZHQ 二、 混元世界模型上新,综合能力问鼎WorldScore排行榜 1. 腾讯发布混元3D世界模型系列最新成员HunyuanWorld-Voyager,业界首个支持原生3D重建的超长漫游世界模 型; 2. 混元Voyager突破传统视频生成限制,能生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式,且 与混元世界模型1.0高度适配; 3. 该模型在斯坦福大学李飞飞团队发布的WorldScore基准测试中位居综合能力首位,支 ...