融合残差感知网络的威胁情报命名实体识别

Threat Intelligence Named Entity Recognition with Fusion Residual Perception Network

下载PDF

导出

摘要针对通用领域命名实体识别方法难以识别网络安全领域中专业名词等安全实体,且提取特征不充分,导致网络安全实体识别准确率低等问题,提出一种融合残差感知网络的Bi-LSTM-CRF(Res-Inception Bi-LSTM-CRF, RIBIC)模型,通过残差感知网络模型提取多粒度特征,以捕获更丰富的特征信息;并自行构建网络安全领域词典,结合词典匹配校正算法进一步提高实体识别准确率。实验结果表明,在两个威胁情报公开数据集上,F1值分别达到94.09%和83.91%,比基线模型分别高出15.02%和15.72%,充分证明本文方法在威胁情报领域命名实体识别上的有效性。 Addressing the challenges faced by general domain named entity recognition methods,which struggle to identify specialized terms and security entities within the cybersecurity domain,and suffer from insufficient feature extraction leading to low accuracy in cybersecurity entity recognition,this paper introduces a new model named Res-Inception Bi-LSTM-CRF(RIBIC).The RIBIC model leverages a Res-Inception Network to extract multi-granularity features,thereby capturing a richer set of feature information.Furthermore,an in-house cybersecurity domain-specific dictionary is developed,and a dictionary-based matching correction algorithm is incorporated to enhance the precision of entity recognition.The experimental results indicate that on two publicly available threat intelligence datasets,the F1 scores achieved are 94.09%and 83.91%,representing improvements of 15.02%and 15.72%over the baseline models,respectively.These findings robustly validate the effectiveness of the proposed method for named entity recognition in the threat intelligence domain.

作者曾文丽陈继鑫 ZENG Wen-li;CHEN Ji-xin(Sichuan University of Science&Engineering of Computer Science and Engineering,Yibin 644000,China;The Key Laboratory of Higher Education of Sichuan Province for Enterprise Informationalization and Internet of Things,Yibin 644000,China)

机构地区四川轻化工大学计算机科学与工程学院企业信息化与物联网测控技术四川省高校重点实验室

出处《电脑与电信》 2025年第4期30-37,共8页 Computer & Telecommunication

基金企业信息化与物联网测控技术四川省高校重点实验室,项目编号:2022WYJ03 四川轻化工大学2023年校级教学改革研究项目“产教融合背景下网络安全综合实验教学改革探索与实践”资助,项目编号:JG-2307。

关键词威胁情报命名实体识别残差感知网络 Cyber Threat Intelligence Named Entity Recognition Res-Inception Network

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1潘正高.基于规则和统计相结合的中文命名实体识别研究[J].情报科学,2012,30(5):708-712. 被引量：34
2曹春萍,关鹏举.基于E-CNN和BLSTM-CRF的临床文本命名实体识别[J].计算机应用研究,2019,36(12):3748-3751. 被引量：18
3QIN Ying,ZENG Yingfei.Research of Clinical Named Entity Recognition Based on Bi-LSTM-CRF[J].Journal of Shanghai Jiaotong university(Science),2018,23(3):392-397. 被引量：18
4罗凌,杨志豪,宋雅文,李楠,林鸿飞.基于笔画ELMo和多任务学习的中文电子病历命名实体识别研究[J].计算机学报,2020,43(10):1943-1957. 被引量：55
5董瑞,杨雅婷,蒋同海.融合多种语言学特征的维吾尔语神经网络命名实体识别[J].计算机应用与软件,2020,37(5):183-188. 被引量：6
6王笑月,李茹,段菲.一种基于门控空洞卷积的高效中文命名实体识别方法[J].中文信息学报,2021,35(1):72-80. 被引量：7
7秦娅,申国伟,赵文波,陈艳平.基于深度神经网络的网络安全实体识别方法[J].南京大学学报（自然科学版）,2019,55(1):29-40. 被引量：24
8王瀛,王泽浩,李红,黄文军.基于深度学习的威胁情报领域命名实体识别[J].东北大学学报（自然科学版）,2023,44(1):33-39. 被引量：5
9周景贤,王曾琪.基于ALBERT的网络威胁情报命名实体识别[J].陕西科技大学学报,2023,41(1):187-195. 被引量：2

二级参考文献38

1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：201
2张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：69
3周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
4ZHANG Yimin,ZHOU J F.A traninable method for extracting Chinese entity names an their relations[].proc of the nd Chinese Language Processing Workshop.2000
5余肖生,孙珊.基于信息抽取的文本知识挖掘模型研究[J].情报科学,2010,28(5):776-778. 被引量：7
6衣马木艾山.阿布都力克木,吐尔地.托合提,艾斯卡尔.艾木都拉.基于规则的维吾尔人名汉文机器翻译算法研究[J].计算机应用与软件,2010,27(8):86-87. 被引量：9
7李佳正,刘凯,麦热哈巴.艾力,吕雅娟,刘群,吐尔根.依布拉音.维吾尔语中汉族人名的识别及翻译[J].中文信息学报,2011,25(4):82-87. 被引量：13
8高强,游宏梁.基于层叠模型的国防领域命名实体识别研究[J].现代图书情报技术,2012(11):47-52. 被引量：5
9ZHOU Junsheng,QU Weiguang,ZHANG Fen.Chinese Named Entity Recognition_via Joint Identification and Categorization[J].Chinese Journal of Electronics,2013,22(2):225-230. 被引量：21
10邱泉清,苗夺谦,张志飞.中文微博命名实体识别[J].计算机科学,2013,40(6):196-198. 被引量：33

共引文献156

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：4
2陈明,刘蓉,熊回香.基于医疗知识图谱的智能问答系统研究[J].情报科学,2023,41(12):118-126. 被引量：20
3刘雨可,周申培,石英,杜家宝.面向配网一次设备缺陷文本命名实体识别研究[J].武汉理工大学学报,2022,44(10):93-101. 被引量：5
4熊奥,高畅,赵明辉,张玲玲.基于知识图谱的核电设备健康管理知识建模与分析[J].科技促进发展,2021,17(4):640-649. 被引量：16
5李湘东,巴志超,黄莉.基于加权隐含狄利克雷分配模型的新闻话题挖掘方法[J].计算机应用,2014,34(5):1354-1359. 被引量：14
6栗伟,赵大哲,李博,彭新茗,刘积仁.CRF与规则相结合的医学病历实体识别[J].计算机应用研究,2015,32(4):1082-1086. 被引量：49
7段宇锋,朱雯晶,陈巧,刘伟,刘凤红.条件随机场与领域本体元素集相结合的未登录词识别研究[J].现代图书情报技术,2015(4):41-49. 被引量：3
8通拉嘎,刘凯,李佳正.基于最大熵的蒙古文人名识别系统的设计与实现[J].图书馆理论与实践,2015(5):96-98.
9王克永,刘纪平,罗安,王勇.前后缀与特征词相结合的地名地址提取[J].测绘通报,2016(2):64-68. 被引量：17
10刘艳超,郭剑毅,余正涛,周兰江,严馨,陈秀琴.融合实体特性识别越南语复杂命名实体的混合方法[J].智能系统学报,2016,11(4):503-512. 被引量：3

1王琪凯,刘孙俊,何俊江,兰小龙,方文波.基于表格填充的网络威胁情报关系三元组抽取[J].微电子学与计算机,2025,42(7):82-92. 被引量：1
2电竞视野[J].微型计算机,2020,0(9):60-61.
3刘文龙,李兵.情报公开的决策动机、潜在矛盾与战略启示[J].情报杂志,2024,43(1):64-69. 被引量：2
4韩关锋,陈刚.后台前置:美国情报透明原则的发展、实践及启示[J].情报杂志,2024,43(5):21-27. 被引量：2
5黄莉,倪倩,谢建琴.医学教学实践中专业课程思政教学体系建设初探[J].教育教学论坛,2025(28):65-68.
6袁满,赵兴雨,袁靖舒,马茁然.多特征融合的油气勘探领域命名实体识别与应用[J].吉林大学学报(信息科学版),2025,43(2):401-411.
7陈红红,王志涛,骆军军,董晓辉.知识图谱嵌入的机械故障问题生成[J].西北师范大学学报(自然科学版),2025,61(4):82-90.
8冯叶.分子生物学课程教学中专业术语的英中语言差异分析[J].分子植物育种,2025,23(14):4651-4655.
9毛晓蕾.基于语义识别的服务热线工单智能分类研究[J].城市轨道交通研究,2025,28(5):193-198.
10潘红光,董佳瑶,白佩云,李山,马彪.煤矿安全监测领域事故溯源知识库构建[J].西安科技大学学报,2025,45(3):524-533. 被引量：2

电脑与电信

2025年第4期

浏览历史

内容加载中请稍等...

融合残差感知网络的威胁情报命名实体识别

参考文献9

二级参考文献38

共引文献156

相关作者

相关机构

相关主题

浏览历史