AI 新悖论:模型越智能,数据越糟糕
3 6 Ke·2026-01-07 23:11
编者按:人工智能模型的可靠性取决于其底层数据的质量。然而,目前有一个新的悖论,模型越智能,数据可能变得越糟糕。本文来自编译,希望对您有所 启发。 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 人工智能承诺带来更智能、更快速、更高效的未来,但乐观表象之下潜藏着日益恶化的隐忧:数据本身的问题。我们常讨论算法,却鲜少关注支撑算法的基 础设施。事实上,创新速度永远无法超越其输入数据的质量,而当前这些输入数据正显露疲态。当根基开始动摇,即便是最先进的系统也会失灵。 十年前,规模与精度尚能并行不悖。但如今,这两个目标往往背道而驰。隐私法规、设备授权限制及平台新规,使得获取高质量的第一方数据比以往任何时 候都更困难。为填补缺口,市场充斥着看似合法实则虚假的循环利用、伪造或推断信号。 [图片来源:Eugene Mymrin/Getty Images] 1. 当数据量沦为噪音 多年来,行业普遍认为数据越多洞察越精深。数据量象征着实力,输入越多意味着智能越强。但如今数据过剩已沦为干扰噪音。为维持规模,部分供应商采 用了填充数据或虚假信号,使系统看似健康,实则侵蚀了数据的可靠 ...