Workflow
高质量数据集
icon
Search documents
海天瑞声20250625
2025-06-26 14:09
海天瑞声 20250625 摘要 海天瑞声 2022 年业绩受益于自动驾驶视觉数据需求激增,2023 年受 数据出境法规影响收入下滑,但归母净利润扭亏为盈,毛利率因多模态 数据投入和独特数据集需求增加而提升。 数据标注产业预计到 2027 年复合增长率超 20%,政策支持力度加大, 七个试点城市重点发展数据标注企业,预计带动相关产值超 83 亿元, 政策层面将持续关注数据标注领域。 大模型发展驱动数据需求从通用知识向专业知识延伸,国家数据局规划 建设通识、行业通识和专识三类高质量数据集,第三方品牌服务商在垂 直、专业、深度数据挖掘应用方向的需求增加。 预计 2025 年数据标注市场规模将突破 100 亿元,增速超 30%。目前 市场竞争格局中,需求方自建团队占 60%,品牌数据服务商占 35%, 市场集中度提升。 Scale AI 为 AI 和机器学习提供数据标注和管理服务,客户包括自动驾驶、 金融、政府等,与 OpenAI、Meta、微软等合作,2023 年营收近 9 亿 美元,预计 2024 年超 20 亿美元,获 Meta 投资后估值达 290 亿美元。 Q&A 2022 年,海天瑞声的业绩实现快速增长 ...
南财数据周报(51期):10个国家数据要素综合试验区启动建设;高质量数据集技术文件将加快研制
南方财经记者徐小琼 卓皙雯 广州报道 6月3日,国务院正式公布《政务数据共享条例》(以下简称《条例》),对政务数据的目录管理、共享 使用、平台支撑等工作进行部署,推进政务数据安全高效共享利用,进一步提升政府数字化治理能力和 政务服务效能。《条例》作为第一部促进政务数据共享流通的行政法规,标志着我国政务数据管理迈入 法治化新阶段。国家数据局数据资源司相关负责人表示,将积极配合推进条例落地落实,加快公共数据 资源开发利用,更好赋能经济社会高质量发展。 南财数据点评:各政府部门之间的政务数据共享活动一定程度上存在机制不完善、供需对接不充分、责 任边界不清、多头治理等问题,阻碍了政务数据价值的高效利用。而《条例》直面数字政府建设中存在 的"数据孤岛"难题,首次从国家层面以行政法规形式明确了政务数据共享的体制、路径、规则、保障措 施、法律责任等,为政务数据的高效流通提供法治保障。 这不仅是对传统治理模式的系统性革新,更是面向数字文明时代政府治理现代化的主动布局,对提升政 府数字化治理能力和政务服务效能、全面建设数字政府意义深远。 了解详情请点击阅读:《国家首部行政法规推动政务数据共享,治理数据多头收集、回流难》 2.我 ...
中央企业高质量数据集建设和标准化研讨会将召开
news flash· 2025-05-26 11:52
据国家数据局消息,为贯彻落实党中央、国务院决策部署,充分发挥标准在中央企业高质量数据集建设 中的规范和引领作用,助力"人工智能+"专项行动持续深化,全国数据标准化技术委员会秘书处拟于 2025年5月29日上午,组织召开中央企业高质量数据集建设和标准化研讨会。本次研讨会将围绕高质量 数据集建设路径、格式要求、分类模式、质量评测、案例示范等方面,邀请相关专家代表进行技术交流 和实践分享,推动高质量数据集标准助力中央企业人工智能应用场景落地。 ...
建设高质量数据集,让人工智能更聪明(新视点)
Ren Min Ri Bao· 2025-05-20 21:51
建设高质量数据集,有关方面在积极行动。国家数据局等17部门联合印发的《"数据要素×"三年行动计 划(2024—2026年)》提出,"推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量 人工智能大模型训练数据集"。第八届数字中国建设峰会上,国务院国资委发布首批10余个行业、30项 央企人工智能行业高质量数据集,涵盖了电网调度AI负荷预测数据集、核电SPV设备健康诊断、运行异 常及故障预测数据集、金融大模型数据集等。 "随着基础模型开源态势的形成,各方在算力和模型算法层面的差距正在不断收窄,数据要素价值更加 凸显,已成为人工智能竞争的核心领域。"国务院国资委规划发展局副局长胡武婕表示,要推动行业高 质量数据集加速汇聚共享,为人工智能产业提供充足"养分",从而持续进行不同场景的训练优化,推动 基础模型在千行百业落地应用。 目前,高质量数据集建设还存在不少挑战。魏亮说,一方面,行业大模型对数据的需求多样,不同行业 部门对模型场景数据的需求各不相同,增加了数据处理和管理的复杂度。另一方面,在行业大模型的实 际建设中,对于构建和采买的数据没有统一衡量标准,不同行业、不同数据源的数据完整性和准确性可 能参差不齐 ...
激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元
Yang Shi Xin Wen· 2025-05-18 01:17
17日,记者从2025数据安全发展大会上获悉,我国将培育壮大一批数据要素产业链上下游企业,预计到2030年,我国数据产业规模将达到7.5万亿元。 公共数据开放共享 激活海量"沉睡数据" 作为全球首个将数据纳入生产要素的国家,我国已初步构建起门类齐全的数据产业链。数据显示,2024年我国年度数据生产总量达41.06泽字节,同比增长 25%。 截至目前,我国数据领域相关企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年我国数据产业规模将达7.5万亿元。 国家数据局局长 刘烈宏:当前我们正谋划构建横向联通、纵向贯通、协调有力的数据基础设施体系,到2029年要基本建成国家数据基础设施主体结构。 在数据要素与产业融合方面,国家正加快打通公共数据共享开放壁垒,推动公共数据与企业数据深度融合,激活海量"沉睡数据"。 构建高质量数据集 加速人工智能发展 眼下,数据已超越传统生产要素,成为驱动人工智能技术突破与产业变革的核心动力。高质量数据集不仅是人工智能模型性能跃升的基石,更重塑了从技术 研发到商业落地的全产业链条。那高质量数据集是如何构建的? 在浙江温州,作为全国数据要素市场化改革的"试验田 ...