Workflow
数据要素与产业加速融合 2030年我国数据产业规模将达7.5万亿元
Yang Shi Wang·2025-05-18 03:46

央视网消息:5月17日,记者从2025数据安全发展大会上获悉,我国将培育壮大一批数据要素产业链上下游企业,预计到2030年,我国数 据产业规模将达到7.5万亿元。 眼下,数据已超越传统生产要素,成为驱动人工智能技术突破与产业变革的核心动力。高质量数据集不仅是人工智能模型性能跃升的基 石,更重塑了从技术研发到商业落地的全产业链条。那高质量数据集是如何构建的? 在浙江温州,作为全国数据要素市场化改革的"试验田",这里构建了一套数据安全与合规体系,保障数据要素规模化流动,形成数据交易 生态圈,让更多数据"活了起来"。 技术人员告诉记者,构建大模型数据集主要包含数据采集、数据清洗、数据标注、质量评估等核心环节。各环节需要根据大模型数据集的 规模大、多样性足、行业垂直属性强等特点进行针对性的技术研发和适配。 数据标注与清洗是高质量数据集建设的关键环节。数据标注通过"贴标签"(如为照片标注"猫""狗")教会人工智能"认知世界",未经标注 的数据如同乱码教材,导致人工智能无法有效学习;数据清洗则通过剔除重复、修正错误等操作净化数据,混乱数据将直接影响人工智能训练 效果。 作为全球首个将数据纳入生产要素的国家,我国已初步构建 ...