在地球科学进入大数据与人工智能驱动的新时代背景下,中国科学院地质与地球物理研究所于2018年成立了地球科学大数据与人工智能中心,并持续打造核心计算平台。2021年综合地球物理联合反演与解释一体化平台(IPIG)建成(详见《综合地球物理联合反演理论、方法及智能计算》(科学出版社,2026)),2022年地球科学大数据与人工智能计算平台(Geo-Bigdata and Artificial Intelligence of Earth Sciences ,简称GeoBayes)建成。
GeoBayes以18世纪哲学家、概率论奠基人托马斯·贝叶斯命名,核心目标是突破传统地球科学研究的瓶颈,通过大数据、人工智能与地球物理理论的深度融合,实现从海量观测数据中高效挖掘地球系统规律的新范式。
一、核心设计理念与技术架构
传统地球科学研究面临两大核心挑战:一是海量多源异构数据难以有效整合与深度挖掘;二是复杂地球物理反问题的高维非线性特性导致计算效率低下、解的不确定性高。GeoBayes平台正是针对这些难题而设计,采用“微服务 + Docker容器化 + Golang”现代云计算架构,将数据存储、算法服务、二次开发环境融为一体,构建了一个高可用、易扩展的智能化计算生态。
平台底层硬件包括超过1.6PB并行分布式对象存储、基于英伟达HGX架构的A100超级AI计算集群,以及InfiniBand HDR 200G高速互联网络,总浮点运算能力达706.3 TFLOPs,人工智能FP16算力高达10.6 PFLOPs(图1)。2025年,平台成功部署本地化安全DeepSeek大语言模型(70B和32B版本),为地学智能分析提供了强大语言理解与科学推理能力。

图1 GeoBayes平台底层运算存设备基本架构图
在软件层面,GeoBayes打破了传统单体应用模式,采用微服务架构实现模块解耦。各功能模块可独立开发、独立部署、独立升级,即使单个服务出现故障也不会影响整个平台运行。这种设计极大提升了平台的稳定性和可维护性,同时支持不同模块使用不同编程语言(如Go、Python、Java),满足了地球科学多学科交叉的复杂需求。
二、主要功能与创新服务
GeoBayes平台围绕“数据-算法-计算-知识”闭环,构建了三大核心功能模块:
(1)海量地球科学数据统一管理与高效访问。平台实现了结构化与非结构化数据的标准化存储、快速查询和可视化管理,为科研人员提供了“一站式”数据服务,显著降低了数据获取门槛。
(2)地球物理智能反演与解释一体化。平台集成了IPIG系统,支持多物理场联合反演、深度学习驱动的地震全波形反演、AVO属性分析等前沿算法,特别在薄储层识别、天然气水合物微局部分析等领域形成了特色专业服务。
(3)人工智能算法与二次开发环境。平台不仅预置了TensorFlow、PyTorch等主流深度学习框架,还开发了一系列地学专用智能算法,包括基于物理信息神经网络(PINNs)的正反演技术、Transformer盲反演、地震断层智能识别等。同时提供友好的二次开发接口,支持科研人员快速构建个性化模型。
通过这些功能,GeoBayes正在推动地球科学研究从“人工密集型”向“数据智能驱动型”转变,帮助科研团队更高效地处理复杂地球物理问题,加速科学发现进程。在GeoBayes支持下,研究所近年在JGR-Solid Earth、Geophysics 、GJI、Geoscience Data Journal等期刊发表了一系列与Big data & AI相关的学术论文多篇,内容涉及深度学习驱动的地震全波形反演、多物理场联合反演的智能计算、页岩微观孔隙的语义分割,以及量子计算在地球物理正反演中的探索等。

(a) GEOBAYES主界面

(b) 平台人工智能算法服务界面

(c) 地球科学数据库界面

(d)用户算法二次开发服务界面

(e)IPIG主界面
图2 GeoBayes功能展示图
三、未来展望
GeoBayes平台的建设,本质上是为地球科学研究打造一个“智能研究引擎”。它不仅解决了传统研究中数据孤岛、计算资源分散、算法复用率低等长期痛点,更通过贝叶斯统计思想与现代人工智能的结合,为地球物理反问题的不确定性量化、复杂系统智能建模提供了新路径。
展望未来,平台将进一步拓展量子计算在地学反演中的应用,深化与大语言模型的融合,逐步构建覆盖固体地球、行星科学等多领域的地球系统智能计算体系,最终实现“让数据说话、让人工智能辅助发现”的目标。
GeoBayes平台是研究所面向国家重大需求、推动地球科学范式变革的重要基础设施。目前已服务全所及国内外多个科研团队,显著提升了研究效率和创新能力。未来,我所将继续优化平台功能,吸引更多地学研究者加入,共同构建开放共享的地球科学大数据与人工智能生态。