基于模糊邻域信息熵与互判别指数的多标记特征选择算法

A Multi-label Feature Selection Algorithm Based on Fuzzy Neighborhood Information Entropy and Mutual Discriminant Index

下载PDF

导出

摘要多标记特征选择通过去除无关特征来提升学习模型的性能。然而,大多数现有方法假设训练集中的标记仅包含简单的逻辑值,并认为所有相关标记对实例的作用相同。除此之外,在实际应用中,不同标记对实例的影响程度可能存在差异。基于此,提出一种基于模糊邻域信息熵与互判别指数的特征选择方法,首先采用标记增强技术将原始多标记数据集转换为标记分布数据集;继后通过邻域信息熵来量化标记空间中样本间的相似关系;最终借助模糊邻域互判别指数将特征空间与标记空间相结合,从而识别出具有显著区分能力的特征子集。通过6个数据集的实验综合表明,该算法的分类性能较其他算法更为优异。 Multi-label feature selection improves the performance of learning models by eliminating irrelevant features.However,most existing methods assume that the labels in the training set only contain simple logical values and that all relevant labels have the same effect on instances.In addition,in practical applications,the influence of different labels on instances may vary.Based on this,this paper proposes a feature selection method based on fuzzy neighborhood information entropy and mutual discriminant index.Firstly,the original multi-label datasets are transformed into label distribution datasets by using label enhancement technology.Then,the neighborhood information entropy is used to quantify the similarity relationship between samples in the label space.Finally,the feature space and the label space are combined by using the fuzzy neighborhood mutual discriminant index to identify the feature subset with significant discrimination ability.Experiments on six datasets comprehensively show that the classification performance of this algorithm is superior to that of other algorithms.

作者吴立胜鄂晨 WU Li-sheng;E Chen(Jiangxi University of Technology,Nanchang 330098,China)

机构地区江西科技学院信息工程学院

出处《电脑与电信》 2025年第4期17-22,共6页 Computer & Telecommunication

关键词特征选择模糊邻域多标记学习 feature selection fuzzy neighborhood multi-label learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1孙林,马天娇,薛占熬.基于Fisher score与模糊邻域熵的多标记特征选择算法[J].计算机应用,2023,43(12):3779-3789. 被引量：5
2耿新,徐宁.标记分布学习与标记增强[J].中国科学：信息科学,2018,48(5):521-530. 被引量：17

二级参考文献15

1吴迪,郭嗣琮.改进的Fisher Score特征选择方法及其应用[J].辽宁工程技术大学学报（自然科学版）,2019,38(5):472-479. 被引量：12
2段洁,胡清华,张灵均,钱宇华,李德玉.基于邻域粗糙集的多标记分类特征选择算法[J].计算机研究与发展,2015,52(1):56-65. 被引量：114
3余鹰.多标记学习研究综述[J].计算机工程与应用,2015,51(17):20-27. 被引量：13
4姚晟,徐风,赵鹏,刘政怡,陈菊.基于改进邻域粒的模糊熵特征选择算法[J].南京大学学报（自然科学版）,2017,53(4):802-814. 被引量：6
5刘艳,程璐,孙林.基于K-S检验和邻域粗糙集的特征选择方法[J].河南师范大学学报（自然科学版）,2019,47(2):21-28. 被引量：35
6刘琨,封硕.加强局部搜索能力的人工蜂群算法[J].河南师范大学学报（自然科学版）,2021,49(2):15-24. 被引量：15
7张志浩,林耀进,卢舜,郭晨,王晨曦.缺失标记下基于类属属性的多标记特征选择[J].计算机应用,2021,41(10):2849-2857. 被引量：1
8滕俊元,高猛,郑小萌,江云松.噪声可容忍的软件缺陷预测特征选择方法[J].计算机科学,2021,48(12):131-139. 被引量：5
9汪正凯,沈东升,王晨曦.基于文本分类的Fisher Score快速多标记特征选择算法[J].计算机工程,2022,48(2):113-124. 被引量：8
10孙林,黄苗苗,徐久成.基于邻域粗糙集和Relief的弱标记特征选择方法[J].计算机科学,2022,49(4):152-160. 被引量：16

共引文献20

1黄锦涛,钱文彬,王映龙.基于标记增强的多标记代价敏感特征选择算法[J].小型微型计算机系统,2020,41(4):685-691. 被引量：4
2姚成亮,朱庆生.基于自然邻居的标记分布学习[J].计算机科学,2020,47(8):132-136. 被引量：1
3邵佳鑫,原盛,刘新媛,刘睿馨.样本稀疏表达的标记分布学习算法[J].西安交通大学学报,2020,54(11):139-148. 被引量：2
4刘睿馨,刘新媛,李晨.基于低秩表示的标记分布学习算法[J].模式识别与人工智能,2021,34(2):146-156. 被引量：5
5熊传镇,钱文彬,王映龙.基于标记增强和模糊辨识度的标记分布特征选择[J].数据采集与处理,2021,36(3):529-543. 被引量：1
6杨静波,赵启军,吕泽均.引入标记分布的人脸表情图像生成[J].现代计算机,2021,27(12):78-82. 被引量：1
7黄雨婷,徐媛媛,张恒汝,闵帆.三角距离相关性的标签分布学习[J].智能系统学报,2021,16(3):449-458.
8杨静波,赵启军,吕泽均.维度情感模型下的表情图像生成及应用[J].西安电子科技大学学报,2021,48(5):30-37. 被引量：2
9秦天,滕齐发,贾修一.结合局部标记序关系的弱监督标记分布学习[J].智能系统学报,2023,18(1):47-55.
10张远健,赵天娜,苗夺谦.基于粒的标记增强标记分布学习[J].智能系统学报,2023,18(2):390-398.

1徐兴敏,钱茂升,陈淑婉,王银菊,舒友菊,韩立,卞华.基于Box-Behnken响应面法优化超声提取黄连下脚料中盐酸小檗碱研究[J].河南化工,2025,42(7):17-22.
2曹湛慧,林华娟,高加龙,刘寿春,周浓,王辉.“食品分析实验”课程考核改革研究[J].农产品加工,2025(12):126-129.

电脑与电信

2025年第4期

浏览历史

内容加载中请稍等...

基于模糊邻域信息熵与互判别指数的多标记特征选择算法

参考文献2

二级参考文献15

共引文献20

相关作者

相关机构

相关主题

浏览历史