滑坡地质灾害语料库构建与命名实体识别被引量：1

Corpus construction and named entity recognition for landslide hazards

下载PDF

导出

摘要从描述滑坡地质灾害的海量文本中抽取有价值的滑坡地质灾害实体是构建滑坡地质灾害知识图谱的基础.基于滑坡地质灾害勘察报告等相关非结构化文本数据,依据滑坡灾害机理分析滑坡地质灾害文本语言描述特点,制定了滑坡地质灾害语义信息的标注体系与标注规范,构建了面向滑坡地质灾害领域的语料库.基于该语料库的实体识别实验结果表明,命名实体识别模型的精确率、召回率和F1值均达到90%以上,验证了该语料库的适用性,可以为后续滑坡地质知识图谱的研究提供有力的数据支撑. Extracting valuable landslide geohazard entities from massive texts describing landslide hazards is the basis for constructing a related knowledge graph.Based on unstructured text data such as landslide hazard investigation reports,this paper analyzes the linguistic description characteristics according to landslide mechanisms,formulates an annotation system and annotation specifications for semantic information related to landslides,and constructs a corpus tailored to the field of landslide hazards.Experimental results of entity recognition based on the constructed corpus show that the precision,recall rate,and F1-score of the named entity recognition model all exceed 90%,which verifies the applicability of the corpus and provides robust data support for subsequent research on knowledge graph of landslide geology.

作者李秋荣刘晓晓王波代文崔雅婷尚丹丹刘元民 LI Qiurong;LIU Xiaoxiao;WANG Bo;DAI Wen;CUI Yating;SHANG Dandan;LIU Yuanmin(School of Remote Sensing&Geomatics Engineering,Nanjing University of Information Science&Technology,Nanjing 210044,China;Beijing Institute of Geological Disaster Prevention and Control,Beijing 100120,China;School of Geographical Sciences,Nanjing University of Information Science&Technology,Nanjing 210044,China;School of Spatial Informatics and Geomatics Engineering,Anhui University of Science&Technology,Huainan 232001,China;School of Geography,Nanjing Normal University,Nanjing 210023,China)

机构地区南京信息工程大学遥感与测绘工程学院北京市地质灾害防治研究所南京信息工程大学地理科学学院安徽理工大学空间信息与测绘工程学院南京师范大学地理科学学院

出处《南京信息工程大学学报》北大核心 2025年第4期601-610,共10页 Journal of Nanjing University of Information Science & Technology

基金国家自然科学基金(42301478) 江苏高校哲学社会科学研究一般项目(2023SJYB0179) 江苏省研究生实践创新计划项目(SJCX24_0494)。

关键词标注体系滑坡地质灾害语料库命名实体识别标注规范 annotation system landslide hazards text corpus named entity recognition annotation specifications

分类号 P694 [天文地球—地质学] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献22

1许强,崔圣华,黄维,裴向军,范宣梅,艾瑛,赵伟华,罗永红,罗璟,刘明,夏敏,王飞,彭大雷,郑光,陈婉琳.面向工程地质领域的滑坡知识图谱构建方法研究[J].武汉大学学报（信息科学版）,2023,48(10):1601-1615. 被引量：30
2吴龙华,朱月霞,侯振华,王志辉.基于“互联网+”思路的地质大数据平台建设研究[J].中国矿业,2023,32(5):65-74. 被引量：7
3魏东琦,江宝得,张静雅.非结构化地质数据内容存储方法研究[J].西北地质,2021,54(4):266-273. 被引量：7
4史培军.五论灾害系统研究的理论与实践[J].自然灾害学报,2009,18(5):1-9. 被引量：196
5杨腾飞,解吉波,李振宇,李国庆.微博中蕴含台风灾害损失信息识别和分类方法[J].地球信息科学学报,2018,20(7):906-917. 被引量：29
6胡段牧,袁武,牛方曲,袁文,韩嫒嫒.中文文本蕴含气象灾害事件信息多模型融合抽取方法[J].地球信息科学学报,2022,24(12):2342-2355. 被引量：9
7刘淑涵,王艳东,付小康.利用卷积神经网络提取微博中的暴雨灾害信息[J].地球信息科学学报,2019,21(7):1009-1017. 被引量：17
8刘文聪,张春菊,汪陈,张雪英,朱月琴,焦守涛,鲁艳旭.基于BiLSTM-CRF的中文地质时间信息抽取[J].地球科学进展,2021,36(2):211-220. 被引量：16
9张雪英,叶鹏,王曙,杜咪.基于深度信念网络的地质实体识别方法[J].岩石学报,2018,34(2):343-351. 被引量：40
10张春菊,张磊,陈玉冰,刘文聪,薄嘉晨,肖鸿飞.基于BERT的交互式地质实体标注语料库构建方法[J].地理与地理信息科学,2022,38(4):7-12. 被引量：9

二级参考文献268

1王栋,周菲,李颖芳,刘伟云,王甲威,张倩,崔冬冬.我国甜樱桃产业知识图谱构建研究[J].中国果树,2023(1):104-108. 被引量：14
2李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：30
3任伟,张盛,乔计花,黄金明.基于深度学习的岩石矿物智能识别[J].地质论评,2021,67(S01):281-282. 被引量：8
4李丰丹,刘畅,刘园园,吕霞.地质调查智能空间框架构建与实践[J].地质论评,2019(S01):317-320. 被引量：15
5王蓬辉,李明正,李思.基于数据增强的中文医疗命名实体识别[J].北京邮电大学学报,2020,43(5):84-90. 被引量：14
6史培军.四论灾害系统研究的理论与实践[J].自然灾害学报,2005,14(6):1-7. 被引量：301
7陈衍景,Franco PIRAJNO,赖勇,李超.胶东矿集区大规模成矿时间和构造环境[J].岩石学报,2004,20(4):907-922. 被引量：204
8李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：98
9许建聪,尚岳全,陈侃福,杨建锋.强降雨作用下的浅层滑坡稳定性分析[J].岩石力学与工程学报,2005,24(18):3246-3251. 被引量：105
10张守信.中国地层标准化的建议——中国地层命名法规的建议[J].中国科学院研究生院学报,2005,22(5):604-623. 被引量：8

共引文献574

1刘江,赵开功,张晓蕾,闫力维,李长明,王睿迪.基于知识图谱的选煤法规标准培训平台及应用[J].中国安全科学学报,2024,34(S01):226-233. 被引量：3
2闫军,刘鹏飞,林弘杰.基于区域综合减灾模式的暴雨灾害案例评价研究[J].内蒙古气象,2022(4):35-38.
3闫军,刘鹏飞,田颖.案例教学在气象教育培训中的应用研究[J].科教导刊,2023(14):55-57. 被引量：1
4Yongdeng Lei,Jing’ai Wang,Lili Luo.Drought Risk Assessment of China’s Mid-Season Paddy[J].International Journal of Disaster Risk Science,2011,2(2):32-40. 被引量：5
5Peijun Shi,Jiabing Shuai,Wenfang Chen,Lili Lu.Study on Large-Scale Disaster Risk Assessment and Risk Transfer Models[J].International Journal of Disaster Risk Science,2010,1(2):1-8. 被引量：17
6杨雷,韦韩,龚尚文,赵莺菲.基于LSTM的桥梁养护文本数据的命名实体识别方法[J].公路交通科技,2023,40(S02):187-192. 被引量：1
7张游,王绍强,葛全胜,周蕾.基于GIS的江西省洪涝灾害风险评估[J].长江流域资源与环境,2011,20(S1):166-172. 被引量：23
8汪婧,荣莉莉.面向灾害后果的应急预案体系启动模式[J].自然灾害学报,2015,24(3):1-11. 被引量：5
9张海波.高风险社会中的自然灾害管理——以“2008年南方雪灾”为案例[J].北京行政学院学报,2010(3):38-42. 被引量：17
10孙燕娜,王玉海,廖建辉.救灾需求内涵模式及其指标体系与救助评估研究[J].经济与管理研究,2010,31(6):85-94. 被引量：5

同被引文献1

1陈靖铠,顾家豪,高敏,纪昌权,苑豪杰.基于BERT的风雹灾害实体识别与特征分析[J].中国新技术新产品,2023(14):126-129. 被引量：2

引证文献1

1伍治西,沈旭章.震后网络信息分析的轻量化BERT-CRF模型构建及应用[J].灾害学,2026,41(2):191-198.

1李橙,陈铭丰,苏嘉珺,杨磊,梁海航.基于安全大模型的网络安全威胁检测框架研究[J].计算机应用与软件,2025,42(5):179-190. 被引量：11
2陈思旭,刘独玉,谭小琴,齐星,罗彬.面向专病电子病历的实体语料库构建方法[J].元宇宙医学,2024,1(3):41-46.
3万志文(翻译),Kevin Roose.用于训练AI的数据面临枯竭[J].第一财经,2024(9):102-103.
4《中华医学遗传学杂志》编辑部.关于修订中华系列杂志作者署名与工作单位标注规范的通知[J].中华医学遗传学杂志,2025,42(3):313-313.
5吴静.智能正义视角下的具身智能[J].福建论坛(人文社会科学版),2025(4):42-50. 被引量：1
6黄广乾.东盟非通用语汽车行业平行语料库的构建研究[J].西部学刊,2025(12):5-8.
7李溍溍,徐昇,李培峰.面向金融领域的中文事件关系语料库建设[J].计算机应用与软件,2025,42(6):57-64.
8苏婷.以教材为载体培养高年级学生概括能力——以部编版小学五年级课本为例[J].教育,2025(16):90-92.
9郑鑫鑫,陈凡,孙宝丹,巩建光,江俊慧.基于知识图谱的大豆种植管理知识问答系统[J].计算机科学,2025,52(S1):196-203.
10丁国安,张登化,武阳,郑刘根,朱晓峻.基于GIS的镇域尺度下地质灾害精细化风险评价方法[J].金属矿山,2025(6):241-249. 被引量：4

南京信息工程大学学报

2025年第4期

浏览历史

内容加载中请稍等...

滑坡地质灾害语料库构建与命名实体识别被引量：1

参考文献22

二级参考文献268

共引文献574

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

滑坡地质灾害语料库构建与命名实体识别 被引量：1

参考文献22

二级参考文献268

共引文献574

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

滑坡地质灾害语料库构建与命名实体识别被引量：1