基于有效窗口和朴素贝叶斯的恶意代码分类被引量：14

Malware Classification Approach Based on Valid Window and Naive Bayes

下载PDF

导出

摘要恶意代码分类是恶意代码分析和入侵检测领域中的核心问题.现有分类方法分析效率低,准确性差,主要原因在于行为分析原始资料规模大,噪声高,随机因素干扰.针对上述问题,以恶意代码行为序列报告作为基础,在分析随机因素及行为噪声对恶意代码行为特征和操作相似性的干扰之后,给出一个系统调用参数有效窗口模型,通过该模型加强行为序列的相似度描述能力,降低随机因素的干扰.在此基础上提出一种基于朴素贝叶斯机器学习模型和操作相似度窗口的恶意代码自动分类方法.设计并实现了一个自动恶意代码行为分类器原型MalwareFilter.使用真实恶意代码生成的行为序列报告对原型系统进行评估,通过实验证明了该方法的有效性,结果表明,该方法通过操作相似度窗口提高了训练和分类过程的性能和准确度. Malware classification is the key problem in the field of malicious code analysis and intrusion detection. Existing malware classification approaches have low efficiency and poor accuracy because the raw behavior analysis data is large-scale with high noise data and interfered by random factors. To solve the above issues, taking the malware behavior reports as raw data, this paper analyzes the malware behavior characteristics, the operation similarity, the interference situation of random factors and noisy behavior data. Then it proposes a parameter valid window model for system call which improves the ability of operation sequence to describe behavior similarity. On this basis, the paper presents a malware classification approach based on naive Bayes machine learning model and parameter valid window. Moreover, an automatic malware behavior classifier prototype called MalwareFilter is designed and implemented in this paper. In case study, we evaluate the prototype using system call sequence reports generated through true malware. The experiment results show that our approach is effective, and the performance and accuracy of training and classification are improved through parameter valid window.

作者朱克楠尹宝林冒亚明胡英男

机构地区中国石油信息技术服务中心北京航空航天大学计算机学院中国石油安全环保技术研究院HSE信息中心

出处《计算机研究与发展》 EI CSCD 北大核心 2014年第2期373-381,共9页 Journal of Computer Research and Development

基金中央高校基本科研业务费专项基金项目(YWF-11-03-Q-037)

关键词恶意代码行为分类朴素贝叶斯机器学习入侵检测行为特征操作相似度 malware behavior classification naive Bayes machine learning intrusion detectionbehavior characteristic operation similarity

分类号 TP309.5 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献28

1Symantec Corporation. Symantec Internet security threat report trends for 2010[EB/OL].http://msisac.cisecurity.org/resources/reports/documents/SymantecInternetSecurityThreatReport2010.pdf,2012.
2Linn C,Debray S. Obfuscation of executable code to improve resistance to static disassembly[A].New York:ACM,2003.
3Christodorescu M,Jha S. Static analysis of executables to detect malicious patterns[A].Berkeley,CA:USENIX Association,2003.
4Kruegel C,Kirda E,Mutz D. Automating mimicry attacks using static binary analysis[A].Berkeley,CA:USENIX Association,2005.
5Preda M D,Christodorescu M,Jha S. A semantics based approach to malware detection[A].New York:ACM,2007.377-388.
6Moser A,Kruegel C,Kirda E. Limits of static analysis for malware detection[A].Piscataway,NJ:IEEE,2007.421-430.
7Szor P. The Art of Computer Virus Research and Defense[M].Boston:Addison-Wesley Professional,2005.59-98.
8Popov I V,Debray S K,Andrews G R. Binary obfuscation using signals[A].Berkeley,CA:USENIX Association,2007.275-290.
9Baecher P,Koetter M,Holz T. The Nepenthes platform:An efficient approach to collect malware[A].{H}Berlin:Springer-Verlag,2006.165-184.
10Leita C,Dacier M,Massicotte F. Automatic handling of protocol dependencies and reaction to 0-day attacks with ScriptGen based honeypots[A].{H}Berlin:Springer-Verlag,2006.185-205.

二级参考文献8

1[1]D Tumer,S Entwisle,M Fossi,et al.Symantec Internet security thread report trends for January06-june06.Symantec Corporation,Cupertino,CA,USA,Tech Rep:Volume X,2006
2[2]L A Goldberg,P W Goldberg,C A Phillips,et al.Constructing computer virus phylogenies.Journal of Algorithms,1998,26(1):188-208
3[3]G Erdelyi,E Carrera.Digital genome mapping:Advanced binary malware analysis.The 15th Virus Bulletin Int'lConf,Chicago,IL,2004
4[4]M G Schultz,E Eskin,E Zadok,et al.Data mining methods for detection of new malicious executables.In:Proc of the 2001 IEEE Symp on Security and Privacy.Los Alamitos,CA:IEEE Computer Society Press,2001.38-49
5[5]S Wehner.Analyzing worms using compression.http://homepages.cwi.nl/～wehner/worms,2006
6[6]T Lee,J J Mody.Behavioral classification.The 15th EICAR Conf,Hamburg,Germany,2006
7[7]V Levenshtein.Binary codes capable of correcting deletions.Insertions and Reversals.SovietPhysics Docklady,1966,10(8):707-710
8[8]S B Needleman,C D Wunsch.A general method applicable to the search for similarities in the amino acid sequence of two proteins.Journal of Molecular Biology,1970,48(3):443-453

共引文献3

1孙晓妍,祝跃飞,黄茜,郭宁.基于交互行为的恶意代码检测研究[J].计算机应用,2010,30(6):1489-1492.
2孙晓妍,郭宁,黄茜,祝跃飞.集成时空信息的木马智能检测[J].小型微型计算机系统,2012,33(4):778-784.
3范宇杰,陈黎飞,郭躬德.软件代码的恶意行为学习与分类[J].数据采集与处理,2017,32(3):612-620. 被引量：4

同被引文献230

1金然,魏强,王清贤.基于分支序列距离的恶意代码分类[J].计算机研究与发展,2007,44(z2):52-57. 被引量：4
2吴静,刘衍珩,孟凡雪.入侵检测中的多分类SVM增量学习算法[J].北京工业大学学报,2009,35(12):1697-1702. 被引量：3
3李跃,翟立东,王宏霞,时金桥.一种基于社交网络的移动僵尸网络研究[J].计算机研究与发展,2012,49(S2):1-8. 被引量：10
4李阳,王晓岩,王昆,沙瀛.基于社交网络的安全关系研究[J].计算机研究与发展,2012,49(S2):124-130. 被引量：10
5杨欢,张玉清,胡予濮,刘奇旭.基于权限频繁模式挖掘算法的Android恶意应用检测方法[J].通信学报,2013,34(S1):106-115. 被引量：48
6穆祥昆,王劲松,薛羽丰,黄玮.基于活跃熵的网络异常流量检测方法[J].通信学报,2013,34(S2):51-57. 被引量：21
7穆成坡,黄厚宽,田盛丰,林友芳,秦远辉.基于模糊综合评判的入侵检测报警信息处理[J].计算机研究与发展,2005,42(10):1679-1685. 被引量：50
8魏宇欣,武穆清.智能网格入侵检测系统[J].软件学报,2006,17(11):2384-2394. 被引量：12
9邓维斌,王国胤,王燕.基于Rough Set的加权朴素贝叶斯分类算法[J].计算机科学,2007,34(2):204-206. 被引量：43
10吴正桢,陈秀真,李建华.基于聚类和报警先决条件的网络入侵关联分析[J].计算机工程,2007,33(21):122-124. 被引量：3

引证文献14

1韩红章.基于目标协同规划的网络入侵特征聚类仿真[J].计算机仿真,2015,32(4):273-276. 被引量：2
2秦艳锋,王清贤,曾勇军,奚琪.基于敏感点覆盖的恶意代码检测方法[J].计算机应用研究,2015,32(11):3439-3442. 被引量：1
3付钰,李洪成,吴晓平,王甲生.基于大数据分析的APT攻击检测研究综述[J].通信学报,2015,36(11):1-14. 被引量：90
4郑生军,郭龙华,李建华,王红凯,刘昀.基于云平台的网站安全多维监测系统[J].计算机与现代化,2016(1):39-45. 被引量：5
5刘志永,王红凯,李高磊,伍军,宿雅婷.一种基于主机特征的未知恶意程序动态识别系统[J].计算机与现代化,2016(3):105-110. 被引量：2
6谢小军,陈光喜,丁伯伦.基于属性加权核密度估计的朴素贝叶斯分类算法[J].桂林电子科技大学学报,2016,36(3):231-233. 被引量：3
7谢小军,陈光喜.基于多属性联合的朴素贝叶斯分类算法[J].计算机技术与发展,2016,26(12):77-81. 被引量：3
8范宇杰,陈黎飞,郭躬德.软件代码的恶意行为学习与分类[J].数据采集与处理,2017,32(3):612-620. 被引量：4
9王丽娜,谈诚,余荣威,尹正光.针对数据泄漏行为的恶意软件检测[J].计算机研究与发展,2017,54(7):1537-1548. 被引量：16
10江泽涛,韩立尧,徐智.一种基于感知哈希选择的最邻近入侵检测方法[J].计算机应用与软件,2018,35(4):296-302. 被引量：1

二级引证文献154

1张正欣.计算机恶意代码的检测与查杀[J].产业科技创新,2020(36):67-69.
2张伟剑,赵海斌,王迪.全流量数据分析在企业信息化安全运维中的研究与应用[J].网络空间安全,2021,12(1):24-26. 被引量：6
3王助尧.论邓小平哲学思想的核心和实质[J].探索,2000(2):4-7. 被引量：5
4邱宁佳,高鹏,王鹏,陶跃.基于改进信息增益的ACO-WNB分类算法研究[J].计算机仿真,2019,36(1):295-299. 被引量：6
5宋洁心.网站服务器维护措施探究[J].电子测试,2016,27(3):80-80. 被引量：2
6肖鸣.一种多层次融合的APT防御模型研究与构建[J].中国新通信,2016,18(14):87-87.
7俞艺涵,付钰,吴晓平.基于改进正则表达式规则分组的内网行为审计方案[J].计算机应用,2016,36(8):2241-2245.
8董娜,张君艳,刘伟娜,常杰.电网企业APT攻击防御存在的问题及防御措施[J].河北电力技术,2016,35(4):25-27. 被引量：3
9祝毅鸣,刘莹.高伪装网络入侵行为的辨识方法优化仿真[J].计算机仿真,2016,33(9):296-300. 被引量：3
10雷程,马多贺,张红旗,杨英杰,王淼.基于变点检测的网络移动目标防御效能评估方法[J].通信学报,2017,38(1):126-140. 被引量：12

1崔弘,喻波,方莹.恶意代码分类的一种高维特征融合分析方法[J].计算机应用研究,2017,34(4):1120-1123. 被引量：5
2吴健飞.基于自动参数标准化的指纹分割方法(英文)[J].中国图象图形学报,2008,13(4):672-677.
3范宝德,殷明.高级语言程序远程调用参数的转换[J].计算机工程与设计,1998,19(3):29-33. 被引量：1
4陈共龙.恶意代码分析技术综述[J].无线互联科技,2014,11(3):113-114. 被引量：1
5翁雪城,杨云江.恶意代码的分析与检测技术的研究[J].科技资讯,2012,10(5):19-20. 被引量：3
6舒辉,李政廉,康绯,张媛媛.基于环境智能匹配的恶意代码完整性分析方法[J].计算机工程与设计,2015,36(2):341-345.
7朱强,周晓.几种数据流聚类算法分析[J].赤峰学院学报（自然科学版）,2013,29(11):16-17.
8陈荣旺,郭红.基于Web日志挖掘数据预处理技术的研究[J].福建电脑,2007(6):19-19. 被引量：1
9贺甬,杨铭.实验室认可代码使用情况研究[J].中国认证认可,2013(9):51-53.
10任子亭.基于网络的恶意代码分析系统设计与实现[J].价值工程,2012,31(35):190-192. 被引量：2

计算机研究与发展

2014年第2期

浏览历史

内容加载中请稍等...

基于有效窗口和朴素贝叶斯的恶意代码分类被引量：14

参考文献28

二级参考文献8

共引文献3

同被引文献230

引证文献14

二级引证文献154

相关作者

相关机构

相关主题

浏览历史

基于有效窗口和朴素贝叶斯的恶意代码分类 被引量：14

参考文献28

二级参考文献8

共引文献3

同被引文献230

引证文献14

二级引证文献154

相关作者

相关机构

相关主题

浏览历史

基于有效窗口和朴素贝叶斯的恶意代码分类被引量：14