Workflow
AI大厦需要新的地基!
机器之心·2025-05-19 04:03

机器之心报道 编辑:Panda 「Data×AI」范式便是在这一背景中诞生的,传统意义上的 Data Infra(数据基础设施)概念正在走向升级: Data Infra + AI → Data × AI Infra 也就是说,数据系统的作用不再只是为 AI 提供数据,而是本身也成为 AI 工作流程的一部分,与 AI 协同发展。 通过数据与 AI 的一体化融合,「Data×AI」范式有望解决行业数据流通难、多模态数据处理难、质量评估难等诸多问题。 「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了,正如前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 2024 大会上警告的那样:「我 们所知的预训练即将终结。」虽然近几个月由于测试时间计算(test-time compute)范式的快速发展,这个曾经喧嚣一时的观点现在已经少有人提,但数据对 AI 的 重要性却不减反增,已然成为当前正在持续的「大模型大战」中最耀眼的元素之一。 为什么数据很重要?从本质上讲,当前几乎所有 AI 模型都依赖对数据中模式的学习,机器获得智能的过程很大程度上是对训练数据概率分布的 ...