网站地图联系我们所长信箱内部网English中国科学院
 
 
首页概况简介机构设置研究队伍科研成果实验观测合作交流研究生教育学会学报图书馆党群工作创新文化科学传播信息公开
  新闻动态
  您现在的位置:首页 > 新闻动态 > 学术前沿
Science:地球科学中的大数据:新兴实践与前景展望
2024-05-24 | 作者: | 【 】【打印】【关闭

摘要:随着地球观测和模拟技术的进步,地球科学数据的体量呈爆炸式增长。利用这些海量数据可以帮助我们更好地理解地球内部过程的变化规律和驱动机制。Vance等Science文章综述了大数据在水文学、海洋学和大气科学领域的研究进展。另外,文章也探讨了在面对具体科学问题时如何提高数据的可复制性和可再现性,以及数字孪生新技术的应用。

地球科学大数据是指对地球各个子系统开展多种观测和模拟而生成的大量、多样且持续积累的复杂数据。这些数据的整理和分析不仅需要巨量的计算资源,还需要研发新技术和工具。随着各国对大数据人工智能的集中投资和持续关注,大数据已经被应用于多个行业,相关的新技术和工具不断涌现,例如Google Earth Engine、Apache Science Data Analytic Platform、The Pangeo Project等工具显著提升了我们对地球系统的认知水平。

在水文学领域,确定地表水的空间范围并生成数字水文地图是水文学研究的重要分支。基于人工智能的水检测算法等大数据技术已经对全球数字高程模型进行了改进,进而更新了常用的数字水文产品HydroSHEDs,使得地表水的划分更加准确和完整,为生活用水以及农业和工业用水的供应提供了重要信息。在此基础上,为了进一步细化局部地形信息,区分海平面相对高度相同的山岭和山谷的水文特征的差异,衍生了一个水文意义明确的最近邻河道相对高度模型,用于生成大陆尺度洪水淹没图,为应对洪水灾害提供了快速响应的数据支持。

在海洋学领域,随着海洋观测仪器如Argo浮标和水面或水下自主航行器等的大量投放,用于实时收集和传输海洋数据的仪器数量呈指数级增加(图1)。随着这些数据不断同化到海洋模式中,模式模拟海洋三维结构的精度得到显著提高(Wilkin et al., 2023)。此外,这些数据在其他研究领域也得到应用,例如研究水的跨大陆架运输、鲸鱼的叫声检测、船舶交通、热液喷口的热通量和地震学等。

图1 海洋温度测量点数量1995年(A)和2022年(B)的对比图 (Vance et al., 2024)

在大气科学领域,全球气候模式作为研究地球气候系统的重要工具,模拟了大气、海洋、陆面、海冰等多个分量的相互耦合过程。随着计算能力的提高,全球气候模式已经能够提供更高的空间和时间分辨率,使得科学家能够更精确地理解和预测如风暴轨迹、温度和降水模态变化等气候现象。通过国际耦合模式比较计划(Coupled Model Intercomparison Project, CMIP),科学家可以识别各个模式的优势和局限,推动了模式的改进和精确化。此外,国际耦合模式比较计划还促进了科学共同体对模式结果的共识,为政策制定者提供了数据支撑,帮助他们评估和制定应对气候变化的策略。

有研究表明,大数据有五大原则:数量、速度、真实、多样和价值。随着观测数据量的指数级增长和全球气候模式模拟的时空分辨率不断提高,产生的地球科学数据比以往任何时期都要庞大。那么,共享数据就变得越来越重要。为此,Wilson等提出了一个五星指南(图2),目标是帮助读者根据共享的信息完全重复作者的科学成果,以促进地球科学大数据的可复制性和可再现性。另外,数据的收集、存储和管理也逐渐被认为是另一种形式的科学成果 (Fenner et al., 2019)。除了鼓励研究人员研发原始数据的传统激励措施外,还需要鼓励研究人员投入时间妥善管理和集成数据。

图2 鼓励更多研究人员共享数据和代码的五星指南图 (Wilson et al., 2021)

数字孪生是一个基于大数据的新兴研究领域,已经被应用于多个行业并获得了一定的商业价值。地球科学数字孪生的目的是,高精度数字化表征地球系统各子系统之间的相互作用。这需要高质量的数据输入、先进的数值模拟模型以及人工智能技术的运用 (图3),以加深我们对地球系统及其各子系统变化的理解。

图3 地球科学系统数字孪生要素示意图 (Vance et al., 2024)

在未来,我们可以相对轻松地获取各个领域的大数据。然而,如何确保这些数据遵守可查找性、可访问性、可互操作性和可重用性,以及符合集体利益、控制权、责任和道德原则,是我们需要持续努力的方向。此外,随着仪器观测设备和全球气候模式的不断进步,持续推进大数据研究,不仅将进一步丰富我们对地球作为一个复杂、相互关联和动态系统的理解,还将稳固地支持开放科学的理念。

主要参考文献

Fenner M, Crosas M, Grethe J S, et al. A data citation roadmap for scholarly data repositories[J].  Scientific Data, 2019, 6(1): 28.

Vance T C, Huang T, Butler K A. Big data in Earth science: Emerging practice and promise[J]. Science,  2024, 383(6688): eadh9607. (原文链接)

Wilkin J, Rosenfeld L, Allen A, et al. Advancing coastal ocean modelling, analysis, and prediction for the US Integrated Ocean Observing System[J]. Journal of Operational Oceanography, 2017, 10(2): 115-126.

Wilson J P, Butler K, Gao S, et al. A five-star guide for achieving replicability and reproducibility when working with GIS software and algorithms[J]. Annals of the American Association of Geographers, 2021, 111(5): 1311-1317.

(供稿:张博雅,史锋/新生代室)

 
地址:北京市朝阳区北土城西路19号 邮 编:100029 电话:010-82998001 传真:010-62010846
版权所有© 2009- 中国科学院地质与地球物理研究所 京ICP备05029136号 京公网安备110402500032号