基于API序列的可解释恶意代码检测方法被引量：6

Interpretable malicious code detection method based on API sequence

下载PDF

导出

摘要针对基于API序列的恶意代码检测方法中,深度学习方法特征可解释性差,传统机器学习方法依赖人工设计特征以及忽视数据间时序特性等问题,从时序分类的角度,提出一种基于API序列的可解释恶意代码检测方法。将恶意代码动态API调用序列转换为熵时间序列;使用时间序列分类中的shapelet方法提取具有辨别性的特征;使用多种分类器构造检测模型。实验结果表明,该方法能够自主学习具有辨别性的时序特征,能够在兼具高准确率的同时提供模型的可解释性分类依据。 In the malicious code detection method based on API sequence,the feature interpretability of deep learning method is poor,the traditional machine learning method relies on artificial design features and ignores the time series characteristics between data.From the perspective of time series classification,an interpretable malicious code detection method based on API sequence was proposed.The malicious code dynamic API call sequence was converted into an entropy time series.The discriminative features were extracted using the shapelet method in time series classification.A detection model was constructed by multiple classifiers.Experimental results show that the proposed method can automatically extract discriminative time series features,and can provide the interpretable classification basis of the model with high accuracy.

作者高琪琪师智斌覃月明雷海卫 GAO Qi-qi;SHI Zhi-bin;QIN Yue-ming;LEI Hai-wei(No.710 R&D Institute,China State Shipbuilding Corporation Limited,Yichang 443000,China;School of Data Science and Technology,North University of China,Taiyuan 030051,China)

机构地区中国船舶集团有限公司第七一〇研究所中北大学大数据学院

出处《计算机工程与设计》北大核心 2023年第6期1642-1648,共7页 Computer Engineering and Design

基金山西省自然科学基金项目(201801D121155)。

关键词恶意代码检测时间序列分类时序特征信息熵沙箱特征提取可解释性 malicious code detection time series classification time series characteristics information entropy sandbox feature extraction interpretability

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1段玉莹,王凤英.基于级联与深度信念网络的恶意代码分层检测[J].计算机工程与设计,2020,41(7):1815-1820. 被引量：7
2荣俸萍,方勇,左政,刘亮.MACSPMD:基于恶意API调用序列模式挖掘的恶意代码检测[J].计算机科学,2018,45(5):131-138. 被引量：13
3傅依娴,芦天亮,马泽良.基于One-Hot的CNN恶意代码检测技术[J].计算机应用与软件,2020,37(1):304-308. 被引量：24
4陈佳捷,彭伯庄,吴佩泽.基于动态行为和机器学习的恶意代码检测方法[J].计算机工程,2021,47(3):166-173. 被引量：14
5任卓君,陈光.熵可视化方法在恶意代码分类中的应用[J].计算机工程,2017,43(9):167-171. 被引量：9
6周安民,户磊,刘露平,贾鹏,刘亮.基于熵时间序列的恶意Office文档检测技术[J].山东大学学报（理学版）,2019,54(5):1-7. 被引量：3

二级参考文献19

1王宝宗,刘永山,时玉.二维空间中基于约束关系的RNN查询算法[J].计算机工程,2008,34(16):69-71. 被引量：3
2刘荣,刘珩.低信噪比下基于功率谱熵的语音端点检测算法[J].计算机工程与应用,2009,45(33):122-124. 被引量：10
3岳峰,庞建民,赵荣彩,白莉莉.反汇编过程中call指令后混淆数据的识别[J].计算机工程,2010,36(7):144-146. 被引量：3
4王乾,舒辉,李洋,黄荷洁.基于DynamoRIO的恶意代码行为分析[J].计算机工程,2011,37(18):139-141. 被引量：6
5王新志,孙乐昌,张旻,陈韬.基于序列模式发现的恶意行为检测方法[J].计算机工程,2011,37(24):1-3. 被引量：3
6吴丹飞,王春刚,郝兴伟.恶意代码的变形技术研究[J].计算机应用与软件,2012,29(3):74-77. 被引量：7
7张一弛,庞建民,范学斌,姚鑫磊.基于模型检测的程序恶意行为识别方法[J].计算机工程,2012,38(18):107-110. 被引量：5
8韩兰胜,高昆仑,赵保华,赵东艳,王于波,金文德.基于API函数及其参数相结合的恶意软件行为检测[J].计算机应用研究,2013,30(11):3407-3410. 被引量：16
9严承华,程晋,樊攀星.基于信息熵的网络流量信息结构特征研究[J].信息网络安全,2014(3):28-31. 被引量：8
10李盟,贾晓启,王蕊,林东岱.一种恶意代码特征选取和建模方法[J].计算机应用与软件,2015,32(8):266-271. 被引量：13

共引文献63

1钟红月,彭元康,刘浩因.基于Skip-Gram的恶意软件家族检测方法[J].办公自动化,2021,26(9):51-53. 被引量：1
2姜倩玉,王凤英,贾立鹏.基于逆向工程的恶意代码检测[J].中国科技论文在线精品论文,2021(2):148-159.
3陈铁明,项彬彬,吕明琪,陈波,江颉.基于字节码图像和深度学习的Android恶意应用检测[J].电信科学,2019,35(1):9-17. 被引量：5
4朱雪冰,周安民,左政.基于家族行为频繁子图挖掘的恶意代码检测[J].信息安全研究,2019,5(2):105-113. 被引量：4
5张景莲,彭艳兵.基于特征融合的恶意代码分类研究[J].计算机工程,2019,45(8):281-286. 被引量：15
6李国,黄永健,王静,徐俊洁,王鹏.一种基于复合特征的恶意PDF检测方法[J].现代电子技术,2020,43(2):45-48. 被引量：2
7傅依娴,芦天亮,马泽良.基于One-Hot的CNN恶意代码检测技术[J].计算机应用与软件,2020,37(1):304-308. 被引量：24
8王兴凤,黄琨茗,张文杰.基于API序列和卷积神经网络的恶意代码检测[J].信息安全研究,2020,6(3):212-219. 被引量：3
9杨频,朱悦,张磊.基于属性数据流图的恶意代码家族分类[J].信息安全研究,2020,6(3):228-234. 被引量：3
10芦天亮,李国友,吴警,欧阳立,王国栋.计算机病毒中的密码算法应用及防御方法综述[J].科技管理研究,2020,40(2):207-215. 被引量：10

同被引文献40

1李志海,张春平,王子壬,侯永刚,严洪翔,周永真,白杨.结合PCA的K-means算法在专变用户用电行为分析中的应用[J].电力信息与通信技术,2018,16(12):62-67. 被引量：9
2张宇.基于极值特征的雷达侦察数据BIRCH聚类方法[J].电子设计工程,2016,24(9):15-18. 被引量：8
3芦效峰,蒋方朔,周箫,崔宝江,伊胜伟,沙晶.基于API序列特征和统计特征组合的恶意样本检测框架[J].清华大学学报（自然科学版）,2018,58(5):500-508. 被引量：7
4邵紫月,王云峰,张帅,陈林海.基于IoT的可穿戴远程心电监测设备设计[J].单片机与嵌入式系统应用,2021,21(5):74-78. 被引量：7
5吴丽君.基于三维磁场分析的松散耦合变压器分析及优化设计[J].电工技术,2021(7):98-99. 被引量：1
6丁勇.融合时间戳信息的改进SVDPP推荐算法及其分析[J].微型电脑应用,2021,37(12):13-15. 被引量：4
7姚烨,朱怡安,钱亮,贾耀,张黎翔,刘瑞亮.一种基于异质模型融合的Android终端恶意软件检测方法[J].计算机科学,2022,49(S01):508-515. 被引量：7
8仇喆磊,王莉,王晓,韦奕,梅雪.基于I3D-CNN的自闭症分类方法[J].计算机工程与设计,2022,43(6):1644-1650. 被引量：2
9张杨,郝江波.基于注意力机制和残差网络的恶意代码检测方法[J].计算机应用,2022,42(6):1708-1715. 被引量：9
10孔繁春,王婷,李旭东.基于动态网格生成技术和k-means算法的电力客户行为分析方法[J].电子设计工程,2022,30(15):127-131. 被引量：5

引证文献6

1刘超,赵加奎,李君婷,郝文科,王青亮.分布式多维物联网微服务异常检测[J].单片机与嵌入式系统应用,2023,23(10):27-30.
2丁小娜,欧阳晨.基于区块链的智能手机异常代码检测方法[J].信息与电脑,2024,36(2):212-214. 被引量：1
3桑道松.基于知识图谱的恶意软件信息检测方法研究[J].九江学院学报（自然科学版）,2024,39(3):79-84. 被引量：2
4陈敬添.压缩API序列特征的恶意代码检测方法[J].福建电脑,2025,41(7):53-57.
5黄冠英,杨骏,敬思远.基于图元统计和持续同调的时间序列分类算法[J].计算机工程与设计,2025,46(9):2509-2516. 被引量：1
6杨一哲,芦天亮,彭舒凡,李啸林.基于API序列特征工程与特征学习的恶意代码检测方法[J].计算机科学,2025,52(12):321-330.

二级引证文献4

1郑营营,托列吾别克·马杰尼,刘建文,屈湘云,魏子龙.基于知识图谱的变电站自动化RPA系统设计与应用[J].电子技术(上海),2024,53(10):70-71. 被引量：1
2胡宁.区块链数据透明性在用户异常检测中的应用与挑战分析[J].信息系统工程,2025(6):129-132.
3杜瑞芳.基于深度学习的敏感信息数据泄漏检测研究[J].信息化研究,2025,51(3):31-36.
4兰美辉.基于持续路径同调的曲靖避暑旅游消费行为研究[J].云南师范大学学报(自然科学版),2025,45(5):18-22.

1刘文静,郭春,申国伟,谢博,吕晓丹.基于深度学习的勒索软件早期检测方法[J].计算机科学,2023,50(3):391-398. 被引量：2
2林锴,陶传奇,黄志球.面向异常处理的代码智能化推荐[J].计算机科学与探索,2023,17(3):667-677.
3冯冠玺,马超,石小川,张典.Kernel-Shapelets:基于卷积网络的特征子序列学习方法[J].软件导刊,2023,22(4):8-14. 被引量：3
4石立国,李延真,刘继彦,王者龙,王为帅.电动汽车充电站超短期充电负荷预测的改进GRU方法[J].供用电,2023,40(6):42-47. 被引量：13
5胡佳利,王威娜.基于子类聚类和SAX表示的Shapelet快速发现算法[J].吉林化工学院学报,2022,39(11):20-24.
6杨波,张健,李焕洲,唐彰国,李智翔.基于Windows API调用序列的恶意代码检测方法[J].四川师范大学学报（自然科学版）,2023,46(5):700-705. 被引量：2
7彭晏飞,张睿思,王瑞华,郭家隆.少样本知识图谱补全技术研究[J].计算机科学与探索,2023,17(6):1268-1284. 被引量：4
8陈明,刘蓉,张晔.基于多重注意力机制的中文医疗实体识别[J].计算机工程,2023,49(6):314-320. 被引量：4
9张远健,赵天娜,苗夺谦.基于粒的标记增强标记分布学习[J].智能系统学报,2023,18(2):390-398.
10雍心剑,陆正刚.基于CNN-LSTM的轨道车辆轮对运行状态识别方法研究[J].机电工程技术,2023,52(5):19-24. 被引量：1

计算机工程与设计

2023年第6期

浏览历史

内容加载中请稍等...

基于API序列的可解释恶意代码检测方法被引量：6

参考文献6

二级参考文献19

共引文献63

同被引文献40

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于API序列的可解释恶意代码检测方法 被引量：6

参考文献6

二级参考文献19

共引文献63

同被引文献40

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于API序列的可解释恶意代码检测方法被引量：6