mBERT与多源领域自适应协同的工控协议逆向方法

Collaborative mBERT and multi-source domain adaptation for industrial control protocol reverse engineering

下载PDF

导出

摘要【目的】工业控制系统(industrial control system,ICS)中设备间通信过程高度依赖工控协议来实现,协议安全性对保障ICS稳定运行起到关键作用。漏洞挖掘与入侵检测等作为ICS安全防御体系的核心技术组件,其有效性依赖于对工控协议结构及语义功能的精确解析。协议逆向分析作为解析协议结构与语义功能的关键技术,其核心环节语义推断精度直接决定协议理解的准确性。然而,受限于工控协议文档缺失、格式异构性强等现实条件,现有语义推断方法普遍依赖专家经验,存在自动化水平不足、跨协议泛化性能有限等固有瓶颈,难以适应实际工业环境中多源异构协议的高精度解析需求。【方法】为解决上述问题,本文提出mBERT协同多源领域自适应与结构化掩码策略的语义推断方法。通过mBERT模型实现跨协议通用语义表示;利用结合注意力权重与位置编码设计的结构化掩码策略,增强模型对协议结构和语义内在联系的表示能力,提高语义推断方法的自动化程度和效率;利用结合对抗训练的多源领域自适应逐步微调策略,提升模型对多个源协议的语义通用表示能力,增强其在多种工控协议上的适用性,实现关键字语义的有效推断。【结果】在辽宁省石油化工行业信息安全重点实验室的典型能源企业攻防演练靶场中开展实验验证,采集了S7comm、Modbus/TCP和EtherNet/IP三种工控协议数据,并利用协议复杂度评分机制组建训练数据集。结果表明,多源领域自适应逐步微调策略能够显著提升模型性能,将其与结构化掩码策略结合,进一步提高了语义推断精度,且本文方法在精确度、召回率与F_(1)分数指标上均显著优于现有基线方法。【结论】本文提出了mBERT协同多源领域自适应与结构化掩码策略的语义推断方法,在语义推断中采用高维球面映射与多任务损失函数,增强了不同语义类别的区分度与模型对协议语义的深层辨识能力。本文方法不仅显著降低了对人工先验知识的依赖,也提升了语义推断效率与跨协议适用性,为工控协议逆向分析及工业系统安全防护提供了具备理论支撑的新路径。 [Objective]In industrial control systems(ICS),communication between devices rely heavily on industrial control protocols,and the security of these protocols is essential for stable ICS operation.Vulnerability detection and intrusion detection,as core components of the ICS defense framework,require accurate analysis of protocol structures and semantic functions.Protocol reverse engineering serves as a key technique for this purpose,and the precision of semantic inference directly determines the accuracy of protocol understanding.However,due to the absence of protocol documentation and strong format heterogeneity,existing semantic inference methods generally rely on expert knowledge,resulting in insufficient automation and limited cross-protocol generalization.Consequently,they fail to meet the high precision analysis needs of multi-source heterogeneous protocols in real industrial environments.[Methods]To solve the above problem,this study proposed a semantic inference method that integrated mBERT,multi-source domain adaptation,and a structured masking strategy.Cross-protocol semantic representations were achieved through the mBERT model.A structured masking strategy that combined attention weights and positional encoding was designed to enhance the model′s ability to capture intrinsic correlations between protocol structure and semantics,which improved the automation and efficiency of semantic inference.A progressive multi-source domain adaptation strategy with adversarial training further strengthened the model′s generalized semantic representation across multiple source protocols,enhanced its applicability to various industrial control protocols,and enabled effective inference of keyword semantics.[Results]Experiments were conducted in the target range for offensive and defensive drills in typical energy enterprises in the Key Laboratory of Information Security for the Petrochemical Industry in Liaoning Province.Data from three industrial control protocols,S7comm,Modbus/TCP,and EtherNet/IP,were collected,and a training dataset was built using a protocol-complexity scoring mechanism.The results show that the progressive multi-source domain adaptation strategy significantly improves model performance.When it is combined with the structured masking strategy,semantic inference accuracy is further enhanced.The proposed method achieves significantly higher precision,recall,and F_(1)-score compared with existing baseline methods.[Conclusions]This study proposes a semantic inference method that integrates mBERT,multi-source domain adaptation,and structured masking.High-dimensional spherical mapping and multi-task loss functions used in semantic inference improve the distinguishability of different semantic categories and enhance the model′s deeper recognition capability for protocol semantics.The proposed method significantly reduces reliance on manual prior knowledge,increases inference efficiency,and improves cross-protocol applicability.It provides a theoretically grounded new pathway for industrial control protocol reverse engineering and ICS security protection.

作者宗学军易容光刘昱萱何戡史洪岩孙逸菲宁博伟 ZONG Xuejun;YI Rongguang;LIU Yuxuan;HE Kan;SHI Hongyan;SUN Yifei;NING Bowei(College of Information Engineering,Shenyang University of Chemical Technology,Shenyang 110142,Liaoning,China;Key Laboratory of Information Security for Petrochemical Industry in Liaoning Province,Shenyang University of Chemical Technology,Shenyang 110142,Liaoning,China;School of Artificial Intelligence,Shenyang University of Technology,Shenyang 110870,Liaoning,China;School of Electrical Engineering,Shenyang Institute of Science and Technology,Shenyang 110167,Liaoning,China)

机构地区沈阳化工大学信息工程学院沈阳化工大学辽宁省石油化工行业信息安全重点实验室沈阳工业大学人工智能学院沈阳科技学院电气工程学院

出处《沈阳工业大学学报》北大核心 2026年第1期63-73,共11页 Journal of Shenyang University of Technology

基金辽宁省科技重大专项项目(2025JH1/11700021,2024JH1/11700049) 辽宁省应用基础研究计划项目(2025JH2/101300012) 辽宁省自然科学基金项目(2023-MSLH-273)。

关键词工控协议结构化掩码语义推断注意力权重多源领域自适应 mBERT模型词向量对抗训练 industrial control protocol structured mask semantic inference attention weight multi-source domain adaptation mBERT model word vector adversarial training

分类号 TP393.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1曹平.工业控制系统中人工智能的应用前景[J].石化技术,2025,32(10):376-378. 被引量：1
2刘瑶,张亚彬,张鑫,王麟琨,熊文泽,孙铁良.工业控制系统网络安全需求分析和技术趋势[J].自动化博览,2025,42(8):56-61. 被引量：1
3陈页.面向工业控制系统的主动防御技术研究[J].信息记录材料,2025,26(5):96-98. 被引量：1
4连莲,王文诚,宗学军,何戡.面向工业网络流量的实时入侵检测方法[J].沈阳工业大学学报,2025,47(1):98-105. 被引量：4
5刘帅,杨锦辉,欧思程,史晓薇,蒋明.基于C^(2)-GRU模型的网络数据流异常识别方法[J].沈阳工业大学学报,2025,47(4):486-492. 被引量：2
6黄涛,王郅伟,刘家池,龙千禧,况博裕,付安民,张玉清.工控协议安全研究综述[J].通信学报,2024,45(6):60-74. 被引量：7
7宗学军,王润鹏,何戡,连莲.优化随机森林模型的工控网络异常检测[J].沈阳工业大学学报,2024,46(2):197-205. 被引量：4
8连莲,孙世明,王国刚,宁博伟,何戡,孙逸菲,宗学军.基于多尺度潜在特征表示的工业控制协议模糊测试方法[J].计算机应用研究,2025,42(2):545-554. 被引量：4
9付安民,毛安,黄涛,胡超,刘莹,张晓明,王占丰.基于主动交互式学习的工控协议逆向分析[J].西安电子科技大学学报,2023,50(4):22-33. 被引量：4
10李新春,杜昕宜,许驰,李琳,张蕾,张鑫.多尺度特征深度学习的未知工控协议分类方法[J].信息与控制,2025,54(2):241-250. 被引量：2

二级参考文献106

1苗立民,王和琴,梁成宁,黄小林,胡志园,乔运丽.普光气田工业控制系统安全防护技术应用研究[J].中国设备工程,2021(S01):45-47. 被引量：2
2汪萌.基于工业控制系统等级保护的安全策略研究[J].网络空间安全,2022,13(1):78-82. 被引量：4
3李伟明,张爱芳,刘建财,李之棠.网络协议的自动化模糊测试漏洞挖掘方法[J].计算机学报,2011,34(2):242-255. 被引量：68
4潘璠,洪征,周振吉,吴礼发.语义层次的协议格式提取方法[J].通信学报,2013,34(10):162-173. 被引量：10
5黄笑言,陈性元,祝宁,唐慧林.基于状态标注的协议状态机逆向方法[J].计算机应用,2013,33(12):3486-3489. 被引量：8
6唐成华,刘鹏程,汤申生,谢逸.基于特征选择的模糊聚类异常入侵行为检测[J].计算机研究与发展,2015,52(3):718-728. 被引量：49
7孟凡治,刘渊,张春瑞,李桐.基于状态相关字段识别的未知二进制协议状态机逆向方法[J].电讯技术,2015,55(4):372-378. 被引量：2
8吴礼发,王辰,洪征,庄洪林.协议状态机推断技术研究进展[J].计算机应用研究,2015,32(7):1931-1936. 被引量：9
9赖英旭,高春梅.工业控制网络流量特性分析与建模[J].北京工业大学学报,2015,41(7):991-999. 被引量：7
10王辰,吴礼发,洪征,赖海光,庄洪林.一种基于状态融合的协议状态机推断方法[J].解放军理工大学学报（自然科学版）,2015,16(4):322-329. 被引量：3

共引文献20

1郭丽红,曹烨,单锦涛,胡婷婷,纪宇菲.基于HSA技术的IEC104协议安全设计方案[J].南京工程学院学报（自然科学版）,2024,22(1):52-58.
2许伟杰,邹洪,张佳发,曾子峰,江家伟.基于模糊测试技术的工控协议安全性分析系统[J].微型电脑应用,2024,40(9):250-253.
3韩建云,戴春豪,李亚静,曹忠,王双.基于蝴蝶结-贝叶斯网络的航油储运加注控制系统失效分析[J].民航学报,2024,8(5):137-142.
4马如坡,王群,尹强,高谷刚.Modbus TCP协议安全风险分析及对策研究[J].信息网络安全,2024(11):1710-1720. 被引量：4
5杨元冬,刘国庆,邵洁.面向ModbusTCP协议的安全增强方案分析[J].工业信息安全,2024(6):26-33. 被引量：2
6曹存洋.基于数据挖掘的电力通信网络带宽流量异常检测方法[J].中国新技术新产品,2025(5):53-55. 被引量：2
7王英州,张耀方,徐有方,赵若菡,郭舒畅,刘红梅,张永铮,王佰玲,刘红日.工业控制系统物理层报警量关联算法[J].网络与信息安全学报,2025,11(1):178-188.
8陶华宁,刘荣超,刘荣才,黄观龙.基于深度迁移学习的工控网络异常流量自动检测系统[J].自动化与仪器仪表,2025(6):128-131.
9陈熙.基于决策树算法的网络安全态势感知系统优化设计研究[J].华东科技,2025(5):76-78.
10程凤敏,卢山群.基于人工智能的光纤网络异常行为智能化识别研究[J].激光杂志,2025,46(5):189-195. 被引量：1

1何一民,文睿治.江河互济与空间韧性:黄河、长江双流域协同机制对中华文明连续性的塑造研究[J].四川大学学报(哲学社会科学版),2026(1):50-66.
2陈青梅,彭志珍,董青.“互联网+”时代下医疗健康行业信息安全及标准化探究[J].标准生活,2025(5):191-193.
3苗雨欣,宗学军,何戡,连莲,孙逸菲.融合代价敏感的神经网络工控入侵检测方法[J].科学技术与工程,2025,25(25):10773-10781.
4宗学军,孙俊辉,何戡,史洪岩,连莲,宁博伟.融合深度特征与强化学习的工控协议模糊测试方法[J].网络安全与数据治理,2026,45(2):1-11.
5古津榜,洪征,秦素娟,赵敏,陈乾,江川.基于变分自编码器触发器逆向的后门检测方法[J].计算机工程与应用,2026,62(2):245-256.
6冯桃子,李明志,李维新.开源软件在PLC和DCS工业控制系统中的应用探析[J].中国机械,2025(26):89-92.
7何戡,王植,史洪岩,连莲,孙逸菲,宁博伟,宗学军.一种协同表征学习与强化学习的工控协议模糊测试方法[J].网络安全与数据治理,2025,44(12):6-15.
8柯昌全,韩军林,何平.APL双线以太网与传统工业以太网协议在安全仪表系统中的性能对比研究[J].今日自动化,2025(12):53-55.
9王志鹏,万留进,李玉生,吴昊,马鑫,行鸿彦.基于反向传播神经网络的城市环境路径损耗预测研究[J].无线电通信技术,2026,52(1):181-188.
10李頔,李明,刘如飞,边国兴.一种基于车载激光点云的高速公路三维建模技术[J].城市勘测,2026(1):36-45.

沈阳工业大学学报

2026年第1期

浏览历史

内容加载中请稍等...

mBERT与多源领域自适应协同的工控协议逆向方法

参考文献15

二级参考文献106

共引文献20

相关作者

相关机构

相关主题

浏览历史