Workflow
高质量科学数据集
icon
Search documents
对话陈松蹊院士:中国急需加速构建高质量的科学数据集 | 数博会
在2025年数博会期间,《中国经营报》记者专访了中国科学院院士、清华大学教授陈松蹊。他表示,目 前急需组织科学家以公共视野和科学眼光推动高质量数据集建设。 他说道:"中国已经具备了建立高质量数据集的能力和研究实力。从科学观测角度看,我们有自己的观 测数据以及国际的观测数据。从统计学角度而言,我们也已经完全做好了准备。" 无论是学理层面,还是应用场景方面,中国都不逊色于其他国家。"基于这样的实力,我们完全有能力 开展高质量科学数据集相关工作。"陈松蹊说。 记者了解到,陈松蹊团队已经在海洋高质量数据集建设上实现了突破,测试结果达到甚至优于国际水 平,他表示:"我在积极呼吁构建高质量的科学数据集,也在身体力行参与其中,贡献自己的力量。" 《中国经营报》:在超高维大数据统计分析领域,你提出了创新的假设检验方法。如今随着数据量呈指 数级增长,维度愈加复杂,在处理这些"超维"大数据时,现有方法面临哪些新挑战?你认为未来的研究 应如何突破,才能实现更高效、精准的分析? 陈松蹊:传统数据维度较低,统计学中的多元分析多针对固定维度、样本量较大的情况。2000年"人类 基因组计划"之后,超高维问题逐渐凸显。例如在寻找致病基因时, ...