基于图卷积网络的强化学习特征选择方法

Graph Convolutional Network-based Reinforcement Learning for Feature Selection

导出

摘要由于信息技术的发展,各领域数据往往包含大量冗余特征,因此分类模型性能下降.特征选择是一种有效去除冗余特征的数据预处理技术,然而,已有的特征选择方法无法在选择有效特征的同时保证模型较高的分类准确率.为了解决该问题,提出了一种基于图卷积网络的强化学习特征选择方法.以深度Q网络为基本框架,将特征选择问题映射为马尔可夫决策过程.首先,设计了一种基于图卷积网络的状态表示方法,将特征子集转换成图结构,以高效地捕捉特征间关系;接着提出了一种综合考虑特征重要性、特征间相关性和分类性能的奖励函数引导智能体选择高Q值特征,以使得到的特征子集综合考虑几方面性能.在14个公共数据集和脑卒中筛查数据集上进行实验,结果表明:相比于已有的深度Q网络特征选择方法,所提方法在Congress数据集和脑卒中筛查数据集的准确率分别为99%和85%,分别提高了11.0%和3.6%,验证了该方法的有效性和可行性. Due to the development of information technology,data in various fields often contain a large number of redundant features,which leads to the degradation of classification model performance.Feature selection is a data preprocessing technique that effectively removes redundant features.However,existing feature selection methods are unable to select effective features while ensuring high classification accuracy of the model.In order to solve this problem,a graph convolutional network-based reinforcement learning for feature selection is proposed.A deep Q-network is used as the basic framework to map the feature selection problem into a Markov decision process.Firstly,a state representation method based on graph convolutional network is designed to convert feature subsets into graph structures to capture inter-feature relationships efficiently.Then,a reward function considering feature importance,feature-to-feature correlation,and classification performance is designed to guide the agent to select high Q-value features,so that the obtained feature subset combines several aspects of performance.Experiments are performed on 14 public datasets and stroke screening datasets,and the results show that compared with the existing deep Q-network feature selection method,the accuracy of the proposed method on Congress dataset and the stroke screening dataset is 99%and 85%,respectively,which shows an improvement of 11%and 3.6%,respectively,and verifies the validity and feasibility of the method.

作者谢静李凤莲阳佳贾文辉 XIE Jing;LI Fenglian;YANG Jia;JIA Wenhui(College of Electronic Information Engineering,Taiyuan University of Technology,Taiyuan 030024,China;R&D Department,China Academy of Launch Vehicle Technology,Beijing 100076,China;Department of Neurology,Shanxi Provincial People’s Hospital,Taiyuan 030024,China)

机构地区太原理工大学电子信息工程学院中国运载火箭技术研究院研究发展中心山西省人民医院神经内科

出处《湖南科技大学学报(自然科学版)》北大核心 2025年第4期79-88,共10页 Journal of Hunan University of Science And Technology:Natural Science Edition

基金国家自然科学基金项目资助(62171307) 山西省科技合作交流专项项目资助(202304041101035)。

关键词特征选择深度Q网络马尔可夫决策过程状态表示奖励函数 feature selection deep Q-network Markov decision process state representation reward function

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1肖杨,李亚,王海瑞,常梦容.基于皮尔逊相关系数的滚动轴承混合域特征选择方法[J].化工自动化及仪表,2022,49(3):308-315. 被引量：15
2陈许玲,蒋文浩,黄晓贤,范晓慧,甘敏,曹风.基于特征选择与梯度提升决策树的球团矿抗压强度预测[J].钢铁研究学报,2024,36(3):319-327. 被引量：7
3张婧,曹峰,董毓莹,张超,余银中,唐超.基于互信息和遗传算法的特征选择算法[J].山西大学学报（自然科学版）,2024,47(1):1-8. 被引量：5
4Milos Mravik,T.Vetriselvi,K.Venkatachalam,Marko Sarac,Nebojsa Bacanin,Sasa Adamovic.Diabetes Prediction Algorithm Using Recursive Ridge Regression L2[J].Computers, Materials & Continua,2022(4):457-471. 被引量：1
5冀中,张文嘉.集成深度强化学习在股票指数投资组合优化中的应用分析[J].计算机科学与探索,2025,19(1):237-244. 被引量：2
6高新成,邵国铭,张海洋,周中雨.改进二进制麻雀搜索的特征选择及文本聚类[J].重庆理工大学学报（自然科学）,2023,37(8):166-176. 被引量：2

二级参考文献43

1葛雷,李国正,尤鸣宇.多标记学习的嵌入式特征选择[J].南京大学学报（自然科学版）,2009,45(5):671-676. 被引量：13
2彭涛,杨慧斌,李健宝,姜海燕,魏巍.基于核主元分析的滚动轴承故障混合域特征提取方法[J].中南大学学报（自然科学版）,2011,42(11):3384-3391. 被引量：15
3T Umadevi,Naveen F Lobo,Sangamesh Desai,Manjunath Prabhu,黄可为.利用神经网络模型预测球团矿的冷压强度(英文)[J].世界钢铁,2012,12(4):7-16. 被引量：4
4姚登举,杨静,詹晓娟.基于随机森林的特征选择算法[J].吉林大学学报（工学版）,2014,44(1):137-141. 被引量：281
5青格勒,王朝东,侯恩俭,刘洪松,马丽,吴铿.低硅含镁球团矿抗压强度及冶金性能[J].钢铁研究学报,2014,26(4):7-12. 被引量：42
6唐华松,姚耀文.数据挖掘中决策树算法的探讨[J].计算机应用研究,2001,18(8):18-19. 被引量：124
7戴豪民,许爱强,李文峰,孙伟超.基于WMRMR的滚动轴承混合域特征选择方法[J].振动与冲击,2015,34(19):57-61. 被引量：8
8周建民,徐清瑶,张龙,李鹏.结合小波包奇异谱熵和SVDD的滚动轴承性能退化评估[J].机械科学与技术,2016,35(12):1882-1887. 被引量：14
9王海瑞,张楠.基于KPCA-RVM的转子故障诊断[J].价值工程,2017,36(15):154-156. 被引量：2
10吴辰文,梁靖涵,王伟,李长生.基于递归特征消除方法的随机森林算法[J].统计与决策,2017,33(21):60-63. 被引量：61

共引文献26

1徐秀芳,徐丹妍,徐森,郭乃瑄,许贺洋.一种结合谱聚类与关联规则的轴承故障诊断方法[J].计算机测量与控制,2023,31(1):51-58.
2张庆海,于春雨,李文博.金属基陶瓷复合涂层制备研究[J].科技创新与应用,2023,13(3):72-74. 被引量：1
3陈建雄,徐延军.高速公路收费站出入口交通流量分析及预测[J].上海船舶运输科学研究所学报,2023,46(1):42-48. 被引量：1
4刘翠玲,秦冬,凌彩金,郜礼阳,周巧仪,孙晓荣,吴静珠,昝佳睿.基于内在品质参数的乌龙茶等级判别模型建立[J].食品工业科技,2023,44(12):308-318. 被引量：3
5陈硕思.水驱理论曲线在不同类型油藏开发管理的应用[J].山东石油化工学院学报,2023,37(2):32-37.
6胡涛,武梦婷,胡巍,陈秋松,齐冲冲.基于机器学习的粉煤灰活性分类预测[J].中南大学学报（自然科学版）,2023,54(10):3829-3839. 被引量：9
7程俊涵,王书礼,蔡志远.基于AE-LSTM的锂电池剩余使用寿命预测[J].电器与能效管理技术,2023(9):69-75. 被引量：5
8乔庆,谢小风,刘孟如,方婷婷,史俊,阮应君.基于图片特征提取的水泵能耗分析及预测[J].净水技术,2023,42(S02):7-16. 被引量：1
9陈晓彤,岑梓熹,谭静仪,栾雅,彭师师,严波,何震.三种机器学习算法预测心力衰竭死亡的价值研究[J].医学信息,2024,37(11):11-15. 被引量：2
10胡文浩,吴金龙,董建林.基于混合域特征优选的电机轴承故障诊断[J].机械工程与自动化,2024(4):32-35. 被引量：1

1李丽.智慧教学环境下整本书分级阅读教学的探究[J].中国科技期刊数据库科研,2025(12):155-158.
2刘向虹,王飞平,沈立东,徐荣照.基于人工智能技术的卷烟机工作速度自动化调整研究[J].电子设计工程,2025,33(23):51-55.
3司雅昕,刘训强,苏向敬,田书欣.海上风电功率预测研究综述[J].浙江电力,2025,44(11):59-71. 被引量：3
4相克政,李元章.基于机器学习的供热管道泄漏检测[J].中国新技术新产品,2025(21):137-139.
5沈伟,徐力.基于FMCW的配电电缆故障诊断系统设计[J].电气技术与经济,2025(11):357-359.
6张汇文,杨晓霞,高娜,王宁,张翠翠.融合注意力残差机制的BP神经网络在冠状动脉疾病诊断中的应用[J].电子测量与仪器学报,2025,39(9):192-201.
7Ziwei Wei.The Challenges of Talent Drain in Northeast China and Urban Planning Response Strategies[J].Journal of Frontier in Economic and Management Research,2025,1(1):15-27.
8无.第17届亚洲铸造会议暨2025中国铸造活动周在西安成功召开[J].铸造,2025,74(12):1647-1654.

湖南科技大学学报(自然科学版)

2025年第4期

浏览历史

内容加载中请稍等...

基于图卷积网络的强化学习特征选择方法

参考文献6

二级参考文献43

共引文献26

相关作者

相关机构

相关主题

浏览历史