Workflow
计算机行业周报-全球AI产业跟踪:Nvidia发布6.3万亿Token大型AI训练数据库
甬兴证券·2025-02-05 11:03

计算机 行业研究/行业周报 Nvidia 发布 6.3 万亿 Token 大型 AI 训练数据库 ——全球 AI 产业跟踪(2025.1.13-2025.1.17) ◼ 核心观点 Nvidia: 发布 6.3 万亿 Token 大型 AI 训练数据库 据 IT 之家,近日英伟达宣布推出一款名为 Nemotron-CC 的大型英文 AI 训练数据库,总计包含 6.3 万亿个 Token,其中 1.9 万亿为合成 数据。Nemotron-CC 的开发过程中使用了模型分类器、合成数据重述 (Rephrasing)等技术,最大限度地保证了数据的高质量和多样性。同 时他们还针对特定高质量数据降低了传统的启发式过滤器处理权重, 从而进一步提高了数据库高质量 Token 的数量,并避免对模型精确度 造成损害。 Adobe:推出新款生成式 AI 工具 据 IT 之家,近日 Adobe 宣布推出一系列全新的生成式 AI 工具,旨 在自动化处理劳动密集型生产任务,例如批量编辑图像和翻译视频演 示文稿,其中包括"Firefly Bulk Create"应用,该工具允许用户一键快 速调整多达 10,000 张图像的尺寸或替换所有背景 ...