Synthetic Data
Search documents
2025年全球及中国合成数据行业发展驱动因素、市场规模、投融资动态及未来趋势研判:大模型对高质量数据需求量日益增长,合成数据市场规模突破47亿元[图]
Chan Ye Xin Xi Wang· 2025-11-17 01:16
内容概要:合成数据是指通过计算机算法生成的模拟数据,它模拟真实世界的数据分布和特征,通过数 学模型和生成技术,来构建新的数据集,而不是直接来自现实世界的观测或记录。大模型训练和开发对 数据尤其是高质量数据的需求量日益增长,但大模型训练所需数据量却日渐紧张,面临"不够用、不好 用、不能用"等诸多问题,而合成数据凭借其强大的场景模拟和生成能力,为许多缺乏真实观测数据或 进行实体实验成本高昂、风险巨大的前沿领域开辟了新的研究范式。全球合成数据市场规模持续扩大, 市场规模从2021年的11.8亿元迅速扩张至2025年的47.6亿元,期间年复合增长率高达41.8%。得益于其 成熟的技术生态、严格的数据法规以及早期积极的企业采纳,全球合成数据解决方案在北美和欧洲的渗 透率最高,分别为35%-40%、25%-30%之间。中国市场增速最快,由庞大的互联网用户基数、丰富的落 地应用场景和强有力的政策支持驱动,渗透率约为20%-25%。亚太其他地区及新兴市场目前渗透率相对 较低,但增长潜力巨大。聚焦中国市场,数字经济时代下,我国高度重视数据产业发展,全方位给予大 力支持,推动数据产业呈现稳步增长态势,合成数据也迎来良好发展机遇。 ...