基于深度学习的高结构化恶意样本的检测方法被引量：2

High-Structured Malicious Sample Detection Method Based on Deep Learning

导出

摘要随着攻击检测及缓解等安全防护能力的增强,高结构化的文件(如PDF、HTML等)成为当前漏洞利用的主要目标。由于高结构化的文件具有结构复杂、格式多样、自定义规则灵活等特点,恶意样本的模式与规则难以抽取,导致传统基于模式和规则的检测方法难以应对高结构化恶意样本的检测问题。边界值填充、恶意代码嵌入等操作使得恶意样本字节流分布有所改变,依据样本字节流分布差异,本文提出了一种基于深度学习的高结构化恶意样本的检测方法(JLMethod)。该方法使用卷积神经网络对样本文件的字节流特征进行分类,能有效检测出恶意样本。在文档型PDF文件实验中以4.1‰的漏报率、99.59%准确率和在非文档型HTML恶意样本(WebShell)检测实验中以8.5‰的漏报率、98.89%准确率,验证了本文方法在高结构化恶意样本检测方面的可行性。 With the enhancement of security protection capabilities such as attack detection and mitigation,highly structured files(such as PDF,HTML,etc.)have become the main targets of vulnerability exploitation.Due to the structure complexity,formats variety,and the flexibility of customized rules,it is difficult to extract patterns of malicious samples,which brings great challenge to traditional detection techniques based on patterns and rules.It is observed that the construction of malicious samples such as filling boundary values or embedding malicious code can change the distribution of byte streams,thus this paper proposes a method to detect highly structured malicious samples based on deep learning(JLMethod).In details,this method leverage convolutional neural network to classify byte streams features of sample,and then effectively detect malicious samples.Experiment results show that our approach achieves 99.59%accuracy rate and 4.1‰false negative on the detection of highly structured PDF file,98.89%accuracy rate and 8.5‰false negative rate on the detection of highly structured non-document HTML malicious samples(WebShell),which demonstrates the effectiveness of our method.

作者赵磊金银山刘勤亮张羿辰 ZHAO Lei;JIN Yinshan;LIU Qinliang;ZHANG Yichen(School of Cyber Science and Engineering,Wuhan University,Wuhan 430072,Hubei,China)

机构地区武汉大学国家网络安全学院

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2019年第6期571-575,共5页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金（61672394,61872273）

关键词恶意样本深度学习漏洞高结构化 malicious samples deep learning vulnerability highly structured

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1胡建康,徐震,马多贺,杨婧.基于决策树的Webshell检测方法研究[J].网络新媒体技术,2012,1(6):15-19. 被引量：28
2孟正,梅瑞,张涛,文伟平.Linux下基于SVM分类器的WebShell检测方法研究[J].信息网络安全,2014(5):5-9. 被引量：21
3石刘洋,方勇.基于Web日志的Webshell检测方法研究[J].信息安全研究,2016,2(1):66-73. 被引量：33

二级参考文献33

1李万新.Web日志数据挖掘在服务器安全方面的应用[J].中山大学学报论丛,2007,27(5):116-118. 被引量：5
2刘冰.多类SVM分类算法的研究和改进.电脑知识与技术,2007,(6):1590-1593.
3Xiao Yao. Large and Medium-sized Network Intrusions Cases Research[J]. Publishing House Of Electronics Industry, 2010,(10):301-310.
4J. Ross Quinlan. C4. 5: programs for machine learning[M]. San Francisco: Morgan Kaufmann, 1993.
5Yung-Tsung Hou, Yimeng Chang, Tsuhan Chen.Malicious web content detection by machine learning[J]. Expert Systems with Applications,2010,37(1):55-60.
6Osuna E, Freund R, Girosi F. An improved training algorithm for support vector machines[C]//Proceedings of IEEE Workshop on Neural Networks for Signal Processing. Amelia Island, USA: IEEE Press, 1997: 276-285.
7Lin H T, Lin C J, Weng R C. A note on Plat tps probabilistic outputs for support vector machines[J]. Machine Learning, 2007, 68 (3): 267-276.
8Brinker K. On multiclass active learning with support vector machines[C]//Proceedings of European Conference on Artificial Intelligence. 2004: 969-970.
9Yuan X, Lai W, Mei T , et al. Automatic video genre categorization using hierarchical SVM[C]//IEEE International Conference on Image Processing. Atlanta: IEEE Press, 2006: 2905-2908.
10Tong S , Chang. E Support vector machine active learning for image ret rieval[C]//Proceedings of the 9th ACM International Conference on Multimedia. Ottawa, Canada: ACM Press, 2001, 9: 107-118.

共引文献52

1张红瑞.WebShell原理分析与防范实践[J].现代企业教育,2013(20):254-255. 被引量：5
2孟正,梅瑞,张涛,文伟平.Linux下基于SVM分类器的WebShell检测方法研究[J].信息网络安全,2014(5):5-9. 被引量：21
3张庭秀,程光,郭晓军,潘吴斌.Evil-hunter: a novel web shell detection system based on scoring scheme[J].Journal of Southeast University(English Edition),2014,30(3):278-284. 被引量：1
4杜海章,方勇.PHP webshell实时动态检测[J].网络安全技术与应用,2014(12):120-121. 被引量：12
5朱魏魏,胡勇.基于NN-SVM的Webshell检测方法[J].通信与信息技术,2015(2):55-58. 被引量：11
6韦鲲鹏,葛志辉,杨波.PHP Web应用程序上传漏洞的攻防研究[J].信息网络安全,2015(10):53-60. 被引量：12
7叶飞,龚俭,杨望.基于支持向量机的Webshell黑盒检测[J].南京航空航天大学学报,2015,47(6):924-930. 被引量：16
8胡必伟.基于贝叶斯理论的Webshell检测方法研究[J].科技广场,2016(6):66-70. 被引量：7
9石刘洋,方勇.基于Web日志的Webshell检测方法研究[J].信息安全研究,2016,2(1):66-73. 被引量：33
10易楠,方勇,黄诚,刘亮.基于语义分析的Webshell检测技术研究[J].信息安全研究,2017,3(2):145-150. 被引量：9

同被引文献12

1杨成月,李清泉,刘建明.使用双基站无线传感器网络进行电网连续灾害追踪与预警研究[J].武汉大学学报（信息科学版）,2013,38(3):303-306. 被引量：2
2刘亚姝,王志海,侯跃然,严寒冰.信息密度增强的恶意代码可视化与自动分类方法[J].清华大学学报（自然科学版）,2019,59(1):9-14. 被引量：10
3李传煌,吴艳,钱正哲,孙正君,王伟明.SDN下基于深度学习混合模型的DDoS攻击检测与防御[J].通信学报,2018,39(7):176-187. 被引量：36
4张杰,黄仁书,林金霞.基于Deep Learning算法的漏洞扫描技术研究[J].黑河学院学报,2018,9(7):209-210. 被引量：1
5张成彬,赵慧,曹宗钰.基于深度学习的车身网络KWP2000协议漏洞挖掘[J].山东大学学报（工学版）,2019,49(2):17-22. 被引量：6
6李元诚,崔亚奇,吕俊峰,来风刚,张攀.开源软件漏洞检测的混合深度学习方法[J].计算机工程与应用,2019,55(11):52-59. 被引量：16
7龙廷艳,万良,邓烜堃.基于卷积神经网络的JavaScript恶意代码检测方法[J].计算机工程与应用,2019,55(18):89-94. 被引量：13
8夏之阳,易平,杨涛.基于神经网络与代码相似性的静态漏洞检测[J].计算机工程,2019,45(12):141-146. 被引量：18
9杜鹏,丁世飞.基于混合词向量深度学习模型的DGA域名检测方法[J].计算机研究与发展,2020,57(2):433-446. 被引量：22
10李元诚,黄戎,来风刚,毛一凡,蔡力军.基于深度聚类的开源软件漏洞检测方法[J].计算机应用研究,2020,37(4):1107-1110. 被引量：21

引证文献2

1张瑞,王晓菲.基于混合深度学习模型的软件漏洞检测方法[J].电脑知识与技术,2021,17(18):72-73. 被引量：1
2王琼赟,王萌,张亚昊,史睿,郭琪,吴京航.基于投票机制的联邦学习恶意代码检测:以电网为例[J].武汉理工大学学报（信息与管理工程版）,2024,46(4):644-650.

二级引证文献1

1行久红,牛保民.基于文本挖掘的软件漏洞信息知识图谱构建方法[J].无线互联科技,2023,20(12):109-112. 被引量：2

1王世兴,潘丽娜.基于模式识别技术的数据库管理系统体系的构建[J].现代信息科技,2019,3(21):78-80.
2苏春莉,曹新淼.如何设计好的测试用例[J].价值工程,2020,39(3):219-220. 被引量：1
3吴志春,李程,李祥,张树明,朱志军,许欢.三维地质模型教学展示平台的构建[J].中国多媒体与网络教学学报（电子版）,2019(4S):21-23. 被引量：1
4李家辰,张一凡,旷远有,张雪海,沈沂亭.中文期刊论文数据采集技术研究[J].电脑知识与技术,2019,15(12Z):188-189.
5谭志超.Web应用的安全形势与防护策略研究[J].网络安全技术与应用,2019,0(12):21-24. 被引量：2
6贾媛.实验室煤质检测误差减少的对策分析[J].当代化工研究,2020,0(2):25-26. 被引量：5
7泽碧,次仁德吉,吴红,扇敏娜.西藏地区20例新生儿缺氧缺血性脑病的振幅整合脑电图特点分析及其临床意义[J].西藏科技,2020(1):60-63. 被引量：2
8韦海浪,李贵,李征宇,韩子扬,曹科研.基于模式感知元分块技术的Web实体解析算法[J].数据挖掘,2020,10(1):16-29.
9李国,黄永健,王静,徐俊洁,王鹏.一种基于复合特征的恶意PDF检测方法[J].现代电子技术,2020,43(2):45-48. 被引量：2
10何团,唐波,张进,张玉.基于稀疏恢复的MIMO-STAP干扰样本检测方法[J].空军工程大学学报（自然科学版）,2019,20(6):97-103. 被引量：2

武汉大学学报（理学版）

2019年第6期

浏览历史

内容加载中请稍等...

基于深度学习的高结构化恶意样本的检测方法被引量：2

参考文献3

二级参考文献33

共引文献52

同被引文献12

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的高结构化恶意样本的检测方法 被引量：2

参考文献3

二级参考文献33

共引文献52

同被引文献12

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的高结构化恶意样本的检测方法被引量：2