基于双重虚假因果过滤的未知环境下稳定恶意软件检测

Stable Malware Detection in Unknown Environments Based on Dual False Causal Filtering

下载PDF

导出

摘要机器学习模型在恶意软件检测中已被广泛应用。当这些模型在训练环境中正确捕获因果关系时,它们可以在部署环境中提供高准确性的检测结果,前提是两个环境之间的因果结构保持稳定。然而,在实际操作中,由于各种因素会导致环境变化,从而使得原有的因果关系发生改变,导致检测准确性下降。本研究提出一种基于因果推断的统一训练框架CSAFE,用于增强恶意软件检测模型在未知部署环境变化下的稳定性。该框架通过识别和过滤恶意行为与无关特征之间的虚假因果关联(Spurious Correlation)来维持模型对本质因果关系的把握。此外,CSAFE提出了一种细化的因果关系过滤与重建策略,以在保持检测准确性的同时增强模型的环境适应能力。本研究通过两个实际的安卓恶意软件数据集,从分布内准确性、环境变化下的因果关系稳定性以及综合检测能力等方面对CSAFE进行了评估。实验结果表明,CSAFE在各类环境变化场景下,将检测准确性提高了13.4%,同时保持了与基线方法相当的分布内准确性。 Machine learning models have gained widespread application in malware detection.These models demonstrate high detection accuracy in deployment environments when they correctly capture causal relationships under proper training conditions.However,the environmental changes caused by the various factors can alter these causal relationships,significantly decreasing malware detection accuracy in practical operations.In this study,a unified training framework CSAFE based on causal inference designed,was proposed to enhance the stability of malware detection models under unknown deployment environment changes.The framework identified and filtered out Spurious Correlations(SC)between malicious behaviors and irrelevant features,while maintaining essential causal relationships that remain stable across different environments.A refined causal relationship filtering and rebuilding strategy was presented to achieve improved accuracy performance while enhancing environmental adaptability.Two real-world Android malware datasets were applied to examine CSAFE’s performance in three aspects,such as in-distribution accuracy,causal relationship stability under environmental changes,and comprehensive detection capabilities.The experimental results showed 13.4%improvement in detection accuracy under various environmental changes while maintaining comparable in-distribution accuracy with the best baseline methods.

作者蒋屹新张喜铭徐文倩梁志宏杨祎巍毕乐宇徐欢洪超张宇南 JIANG Yi-xin;ZHANG Xi-ming;XU Wen-qian;LIANG Zhi-hong;YANG Yi-wei;BI Le-yu;XU Huan;HONG Chao;ZHANG Yu-nan(Electric Power Research Institute,China Southern Power Grid,Guangzhou 510663,China;Guangdong Provincial Key Laboratory of Power System Network Security,Guangzhou 510663,China;China Southern Power Grid,Guangzhou 510663,China)

机构地区南方电网科学研究院有限责任公司广东省电力系统网络安全企业重点实验室中国南方电网有限责任公司

出处《印刷与数字媒体技术研究》北大核心 2025年第6期315-331,352,共18页 Printing and Digital Media Technology Study

关键词恶意软件检测因果推断机器学习虚假关联过滤双重解耦重加权安卓安全 Malware detection Causal inference Machine learning Spurious correlation filtering Dual decoupling reweighting Android security

分类号 TP309 [自动化与计算机技术—计算机系统结构] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1陈斌,李泽科,余斯航,郭久煜,林碧海,刘延华.基于CA-WOA-BP算法的调度数据网鲁棒性预测[J].南方电网技术,2025,19(2):10-18. 被引量：3
2王栋,李达,王合建.基于深度PCA与贝叶斯优化的区块链异常交易检测[J].南方电网技术,2024,18(9):78-87. 被引量：2

二级参考文献35

1王涛,Ryad Chellali.非线性权重和收敛因子的鲸鱼算法[J].微电子学与计算机,2019,36(1):11-15. 被引量：28
2钱卫宁,邵奇峰,朱燕超,金澈清,周傲英.区块链与可信数据管理:问题与方法[J].软件学报,2018,29(1):150-159. 被引量：166
3胡鑫,陈信,江海敏.电力调度数据网网络安全防护技术研究[J].自动化技术与应用,2018,37(5):20-23. 被引量：10
4崔佳旭,杨博.贝叶斯优化方法和应用综述[J].软件学报,2018,29(10):3068-3090. 被引量：257
5张若雪.自动识别异常波动:机器学习在金融市场的一个应用[J].上海金融,2018,0(11):26-30. 被引量：3
6刘东奇,曾祥君,王耀南.基于信息熵的智能配电变压器终端安全态势评估[J].南方电网技术,2020,14(1):18-23. 被引量：17
7王辉,徐强,唐俊勇,田鹏辉.ANP网络可用性层次化模型评估方法[J].西安工业大学学报,2020,40(5):549-559. 被引量：3
8沈蒙,桑安琪,祝烈煌,孙润庚,张璨.基于动机分析的区块链数字货币异常交易行为识别方法[J].计算机学报,2021,44(1):193-208. 被引量：18
9张艳梅,楼胤成.基于深度神经网络的庞氏骗局合约检测方法[J].计算机科学,2021,48(1):273-279. 被引量：5
10朱会娟,陈锦富,李致远,殷尚男.基于多特征自适应融合的区块链异常交易检测方法[J].通信学报,2021,42(5):41-50. 被引量：16

共引文献3

1王凯亮,何卓怡,叶健鹏,林译涵,马雨欣.多电压等级电网协同规划的容载比优化配置方法[J].南方电网技术,2025,19(7):131-139.
2张楠,朱永奇,郑创,孙娜,薛小明.基于样本熵和CNN-MGM混合模型的超短期风速预测[J].太阳能学报,2026,47(1):645-653.
3范洪玮,李恩甫,阮波,吴纪,万瑶瑶.基于WOA-BP神经网络的微型燃气轮机NO_(X)排放预测模型[J].能源与环境,2026(1):2-7.

1张永顺,刘高仁,刘志军,刘振虎,董海.新型电磁球型手腕解耦驱动机理[J].机械工程学报,2024,60(19):1-10. 被引量：2
2彭程,赵雪峰,邓炜瀚,孟岚,徐建军.基于源荷不确定性的油田综合能源系统优化调度方法[J].东北石油大学学报,2025,49(1):101-116. 被引量：2
3曾文献,张曼钰,孙磊.生成对抗式双重解耦的分阶段阴影去除算法[J].计算机工程与应用,2025,61(20):260-269.
4吴世琛,毛玉明,胡慧中,张文康,邢思瑶,段会清,丁青艳.基于改进YOLO11n的葡萄果叶病害检测方法[J].农业工程学报,2025,41(14):140-147. 被引量：4
5平璐翔,黄可可,林昌露.一种基于多项式的可追踪秘密共享方案[J].应用数学进展,2026,15(1):443-458.
6彭子铭,丁建伟,姚佳旺,田华伟.基于奇异值空间对抗优化的动态后门攻击[J].计算机科学与探索,2026,20(2):510-521.
7韩立志,张培,张洪宇,张勇,丁振飞,李环宇,常文举,裴立家,周新社,张衡,官建中.重度膝内翻单髁置换术冠状面力线矫正的有限元生物力学分析[J].中国骨伤,2026,39(1):52-60.
8王浩天,周学广,王尚文,靳若春,黄万荣,杨文婧,王戟.扩散模型引导的根因分析[J].软件学报,2026,37(2):621-640.
9何婕.生物功能能否为计算神经科学提供解释规范?[J].科学技术哲学研究,2026,43(1):16-21.
10黄鹤光,陆逢春,潘誉,滕天鸿,杨媛媛,文实,林贤超,林荣贵,潘茂恩.胰腺外科研究体系化进展:从机制探索到诊疗技术转化的创新[J].福建医科大学学报(社会科学版),2025,26(6):41-48.

印刷与数字媒体技术研究

2025年第6期

浏览历史

内容加载中请稍等...

基于双重虚假因果过滤的未知环境下稳定恶意软件检测

参考文献2

二级参考文献35

共引文献3

相关作者

相关机构

相关主题

浏览历史