Workflow
建设高质量数据集,让人工智能更聪明(新视点)
Ren Min Ri Bao·2025-05-20 21:51

建设高质量数据集,有关方面在积极行动。国家数据局等17部门联合印发的《"数据要素×"三年行动计 划(2024—2026年)》提出,"推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量 人工智能大模型训练数据集"。第八届数字中国建设峰会上,国务院国资委发布首批10余个行业、30项 央企人工智能行业高质量数据集,涵盖了电网调度AI负荷预测数据集、核电SPV设备健康诊断、运行异 常及故障预测数据集、金融大模型数据集等。 "随着基础模型开源态势的形成,各方在算力和模型算法层面的差距正在不断收窄,数据要素价值更加 凸显,已成为人工智能竞争的核心领域。"国务院国资委规划发展局副局长胡武婕表示,要推动行业高 质量数据集加速汇聚共享,为人工智能产业提供充足"养分",从而持续进行不同场景的训练优化,推动 基础模型在千行百业落地应用。 目前,高质量数据集建设还存在不少挑战。魏亮说,一方面,行业大模型对数据的需求多样,不同行业 部门对模型场景数据的需求各不相同,增加了数据处理和管理的复杂度。另一方面,在行业大模型的实 际建设中,对于构建和采买的数据没有统一衡量标准,不同行业、不同数据源的数据完整性和准确性可 能参差不齐 ...