基于信息熵的不完备数据特征选择算法被引量：5

Feature Selection Algorithm for Incomplete Data Based on Information Entropy

下载PDF

导出

摘要在分析已有不完备信息熵的基础上,提出一种基于相似关系的不完备信息熵,并证明该信息熵的若干性质.给出一个不完备数据特征选择算法,算法以改进的不完备信息熵作为特征选择准则,直接对不完备数据的特征进行熵值分析,并采用顺序前向浮动选择方法解决特征间的相关性问题.最后在UCI实测数据集上的实验表明,文中算法具有更高的准确率和更快的特征选择速度. Grounded on the analysis of the existing incomplete information entropy, the concept of incomplete information entropy based on similarity relations （SIIE） is proposed, and some properties of SIIE are discussed. A feature selection algorithm for incomplete data is presented. In this algorithm, SIIE of incomplete data is calculated directly, and SIIE is taken as the criteria for feature selection. Then, the sequential forward floating search method is employed to addresses the problem of correlation among features. Experiments on UCI database are carried out, and the results indicate the accuracy and efficiency of the proposed algorithm.

作者陈圣兵王晓峰

机构地区合肥学院计算机科学与技术系网络与智能信息处理重点实验室中国科学院合肥智能机械研究所智能计算实验室

出处《模式识别与人工智能》 EI CSCD 北大核心 2014年第12期1131-1137,共7页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金项目(No.61005010) 安徽省自然科学基金项目(No.1308085MF84 1408085MF135) 安徽省高校省级自然科学基金项目(No.KJ2012B149 2013SQRL074ZD) 合肥学院重点建设学科项目(No.2014XK08) 合肥学院学科带头人培养对象项目(No.2014dtr08)资助

关键词特征选择不完备数据不完备信息熵不完备决策表相似关系 Feature Selection, Incomplete Data, Incomplete Information Entropy, IncompleteDecision Table, Similarity Relation

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1张朝阳,田铮.特征有效提取的自适应核特征子空间方法[J].模式识别与人工智能,2013,26(4):392-401. 被引量：2
2Subramanian Appavu Alias Balamurugan,Ramasamy Rajaram.Effective and Efficient Feature Selection for Large-scale Data Using Bayes' Theorem[J].International Journal of Automation and computing,2009,6(1):62-71. 被引量：7
3姚旭,王晓丹,张玉玺,权文.特征选择方法综述[J].控制与决策,2012,27(2):161-166. 被引量：219
4徐燕,李锦涛,王斌,孙春明.基于区分类别能力的高性能特征选择方法[J].软件学报,2008(1):82-89. 被引量：83
5张霞,储尚军,许鸣珠.基于信息粒度的不完备信息系统空值补齐算法[J].小型微型计算机系统,2011,32(4):752-756. 被引量：4
6梁吉业,李超伟,魏巍.基于Rough Sets的特征选择研究进展[J].山西大学学报（自然科学版）,2012,35(2):211-218. 被引量：2

二级参考文献117

1Su-QingHan JueWang.Reduct and Attribute Order[J].Journal of Computer Science & Technology,2004,19(4):429-449. 被引量：24
2杨明,孙志挥.改进的差别矩阵及其求核方法[J].复旦学报（自然科学版）,2004,43(5):865-868. 被引量：71
3王熙照,赵素云,王静红.基于Rough集理论的模糊值属性信息表简化方法[J].计算机研究与发展,2004,41(11):1974-1981. 被引量：14
4卢娇丽,郑家恒.基于粗糙集的文本分类方法研究[J].中文信息学报,2005,19(2):66-70. 被引量：16
5赵世奇,张宇,刘挺,陈毅恒,黄永光,李生.基于类别特征域的文本分类特征选择方法[J].中文信息学报,2005,19(6):21-27. 被引量：21
6徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
7杨明.一种基于改进差别矩阵的核增量式更新算法[J].计算机学报,2006,29(3):407-413. 被引量：77
8苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：394
9杨明.一种基于改进差别矩阵的属性约简增量式更新算法[J].计算机学报,2007,30(5):815-822. 被引量：111
10胡峰,王国胤.属性序下的快速约简算法[J].计算机学报,2007,30(8):1429-1435. 被引量：48

共引文献308

1朱小培,位云朋,闫李,韩茜茜.基于多模态进化计算的特征选择策略[J].中原工学院学报,2021,32(4):71-76.
2赵小强,牟淼.基于变量分块的KDLV-DWSVDD间歇过程故障检测算法研究[J].仪器仪表学报,2021,42(2):244-256. 被引量：8
3唐易,陈奕希,喻洪流,石萍.一种面向下肢假肢的运动意图识别方法及验证[J].信息与控制,2023,52(5):598-606. 被引量：3
4赵洪,沈建忠,王俊,张骋,瞿青.基于客户画像与机器学习算法的电费回收风险预测模型及应用[J].微型电脑应用,2020,36(2):93-96. 被引量：12
5蒋月,Shaker ul Din,刘勇,张寅丹,刘巨峰,陆海霞.一种集成多分类器的面向地理对象遥感影像变化回溯分析方法[J].兰州大学学报（自然科学版）,2020(5):666-676. 被引量：1
6叶志伟,王巧,周雯,王明威,蔡婷,何其祎.进化计算在大规模高维特征选择中的应用综述[J].北方工业大学学报,2024,36(2):8-19.
7费江华,何永辉,孙晨,黄胜标.一种基于特征选择的组合分类器在带钢表面缺陷分类中的应用[J].冶金自动化,2010,34(2):19-23. 被引量：2
8J.Alamelu Mangai,V.Santhosh Kumar,S.Appavu alias Balamurugan.A Novel Feature Selection Framework for Automatic Web Page Classification[J].International Journal of Automation and computing,2012,9(4):442-448. 被引量：3
9Hua-Ping Zhang,Rui-Qi Zhang,Yan-Ping Zhao,Bao-Jun Ma.Big Data Modeling and Analysis of Microblog Ecosystem[J].International Journal of Automation and computing,2014,11(2):119-127. 被引量：5
10崔文岩,孟相如,李纪真,王明鸣,陈天平,王坤.基于粗糙集粒子群支持向量机的特征选择方法[J].微电子学与计算机,2015,32(1):120-123. 被引量：9

同被引文献32

1冯登国,张阳,张玉清.信息安全风险评估综述[J].通信学报,2004,25(7):10-18. 被引量：313
2张义荣,鲜明,王国玉.一种基于网络熵的计算机网络攻击效果定量评估方法[J].通信学报,2004,25(11):158-165. 被引量：54
3刘开第,薛俊锋,庞彦军.特征选择及其常用算法[J].河北建筑科技学院学报,2004,21(4):111-113. 被引量：2
4刘智,端木京顺,王强,王成林.基于熵权多目标决策的方案评估方法研究[J].数学的实践与认识,2005,35(10):114-119. 被引量：91
5林闯,汪洋,李泉林.网络安全的随机模型方法与评价技术[J].计算机学报,2005,28(12):1943-1956. 被引量：91
6陈非,黄树红,张燕平,申弢,高伟.基于信息熵距的旋转机械振动故障诊断方法[J].振动．测试与诊断,2008,28(1):9-13. 被引量：22
7赵芮,王庆生,温会平.基于二维Logistic与Chebyshev映射AES混沌加密算法[J].微计算机信息,2008,24(33):43-45. 被引量：15
8姜伟,方滨兴,田志宏,张宏莉.基于攻防博弈模型的网络安全测评和最优主动防御[J].计算机学报,2009,32(4):817-827. 被引量：156
9刘文军,谷云东.属性依赖性及重要性度量[J].数学的实践与认识,2009,39(7):148-156. 被引量：3
10李杨寰,高峰,李腾,周智敏.特征选择中信息熵的应用[J].计算机工程与应用,2009,45(15):54-57. 被引量：13

引证文献5

1潘庆先,董红斌,韩启龙,王莹洁,丁蕊.一种基于BP神经网络的属性重要性计算方法[J].中国科学技术大学学报,2017,47(1):18-25. 被引量：30
2朱永国,陶斌斌,宋利康,於坚华,欧阳平.基于粗糙集和信息熵的技术成熟度关键技术要素识别方法[J].现代制造工程,2018(1):1-5. 被引量：7
3万琳,夏树进,朱毅,吕泽华.一种改进的基于信息熵的半监督特征选择算法[J].统计与决策,2021,37(17):66-70. 被引量：3
4宋新鹏,张彦波.改进K-means结合深度学习的不完备信息选取[J].计算机仿真,2021,38(9):433-437.
5马锐,葛慧,顾升高,王克克,靳骁,吴丹.一种确定网络安全度量指标体系参考框架的方法[J].信息安全学报,2019,4(1):68-78. 被引量：4

二级引证文献44

1韩义,付旭晨,蔡斌,王研凯,于英利.基于CNN-LSTM组合算法的火电厂存煤量预测[J].洁净煤技术,2024,30(S02):489-493. 被引量：1
2陈溪远.基于BP神经网络模型的鸢尾花分类问题研究[J].新一代信息技术,2022,5(5):146-148.
3胡大伟,李国新,荆红莉,刘光秀,李玉根.热浸镀锌层在中性盐雾试验中的寿命预测研究[J].当代化工,2017,46(8):1550-1552. 被引量：4
4叶文权,陆兴华.基于用户行为的个性化搜索建模[J].智能计算机与应用,2017,7(6):5-8. 被引量：2
5马文娟,董红斌.基于集成卷积神经网络的人脸年龄分类算法研究[J].计算机科学,2018,45(1):152-156. 被引量：11
6朱振国,田松禄.基于权值变化的BP神经网络自适应学习率改进研究[J].计算机系统应用,2018,27(7):205-210. 被引量：20
7袁斌.基于图像处理技术的火灾识别方法的应用与研究[J].现代电子技术,2018,41(13):43-46. 被引量：7
8朱志均,周华英,罗坤豪,吴恺熹.基于机器嗅觉结合BP神经网络的砂仁气味鉴别方法[J].自动化与信息工程,2018,39(4):45-48. 被引量：5
9陈谦,王朝辉,问鹏辉,王帅,王梦浩.基于BP神经网络的浇导混凝土融冰效果预测[J].筑路机械与施工机械化,2018,35(9):56-60. 被引量：5
10郑云水,李程.基于WPA优化神经网络的扼流适配变压器故障诊断研究[J].铁道科学与工程学报,2019,16(4):1067-1073. 被引量：5

1张红梅,贺颖,聂筑平.粗糙集与熵值法在综合评价中的运用述评[J].科技信息,2012(36). 被引量：1
2郭军,赵和鹏,朱长仁.一种基于自适应权值灰关联分析的毫米波/红外融合识别方法[J].计算机工程与科学,2010(2):146-149. 被引量：3
3赵岭忠,王雪松,古天龙,钱俊彦.一种基于熵的OBDD变量排序算法[J].计算机科学,2007,34(2):216-219.
4王亚东,郭茂祖,钱国良.一种基于信息增益与费用评价函数的特征选择准则[J].计算机研究与发展,1999,36(7):788-793. 被引量：6
5吕成戍.基于特征选择和支持向量机的托攻击检测方法[J].计算机应用与软件,2015,32(5):270-272. 被引量：2
6谢娟英,王春霞,蒋帅,张琰.基于改进的F-score与支持向量机的特征选择方法[J].计算机应用,2010,30(4):993-996. 被引量：33
7李康.基于F-score的泡沫图像特征选择[J].中国科技博览,2013(36):391-391.
8王皓,孙宏斌,张伯明.PG-HMI:一种基于互信息的特征选择方法[J].模式识别与人工智能,2007,20(1):55-63. 被引量：6
9张淼,沈毅,王强.基于Tsallis熵冗余度的超谱特征选择算法性能评价[J].光电子．激光,2009,20(6):784-788.
10陈曦,李翔晨,李炜,楼宗元.基于信息熵的谣言信息度量方法[J].华中科技大学学报（自然科学版）,2013,41(S1):413-417. 被引量：5

模式识别与人工智能

2014年第12期

浏览历史

内容加载中请稍等...

基于信息熵的不完备数据特征选择算法被引量：5

参考文献6

二级参考文献117

共引文献308

同被引文献32

引证文献5

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于信息熵的不完备数据特征选择算法 被引量：5

参考文献6

二级参考文献117

共引文献308

同被引文献32

引证文献5

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于信息熵的不完备数据特征选择算法被引量：5