-
题名带光滑约束的大地电磁深度强化学习反演
- 1
-
-
作者
曾晨瑞
熊杰
曹振
张倩玮
袁梦姣
-
机构
长江大学电子信息与电气工程学院
-
出处
《地质科技通报》
北大核心
2026年第1期302-313,共12页
-
基金
国家自然科学基金项目(62273060)。
-
文摘
反演是处理大地电磁测深数据的关键步骤之一,得到了学者的广泛研究。其中基于数据驱动的反演方法主要包括带监督反演和半监督反演,对无监督反演的研究较少。DQN(deep Q-network)是一种经典的深度强化学习算法,作为无监督反演方法最近被用于解决一维大地电磁反演问题,该方法具有不需要训练数据集、对初始模型依赖较小、多次反演能够得到反演结果的概率分布等优点,但存在反演结果不集中的问题。提出了带光滑约束的大地电磁强化学习反演方法(smooth DQN,简称SDQN),该方法基于强化学习框架,将反演问题看成马尔可夫决策问题,并分别定义环境、奖励、智能体等术语;然后将正则化反演的模型约束项引入到奖励中来,从而引导智能体不断调整预测模型的电阻率参数以得到更符合模型约束的结果。理论模型反演结果表明,相较于DQN反演和Occam反演方法,在相同反演次数情况下SDQN方法反演不同噪声水平的观测数据时结果更稳定。西藏扎西康矿集区的大地电磁实测数据反演结果与Occam反演结果基本吻合并与已有的地质解释资料一致。SDQN方法具有反演结果更集中、对观测数据的抗噪能力更强的优点,是解决大地电磁反演问题的新工具。
-
关键词
深度强化学习
大地电磁反演
光滑约束
DQN方法
sdqn方法
-
Keywords
deep reinforcement learning
magnetotelluric inversion
smooth constraint
DQN method
sdqn method
-
分类号
P631.325
[天文地球—地质矿产勘探]
TP18
[自动化与计算机技术—控制理论与控制工程]
-