期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
A Feature Subset Selection Technique for High Dimensional Data Using Symmetric Uncertainty 被引量:1
1
作者 Bharat Singh Nidhi Kushwaha Om Prakash Vyas 《Journal of Data Analysis and Information Processing》 2014年第4期95-105,共11页
With the abundance of exceptionally High Dimensional data, feature selection has become an essential element in the Data Mining process. In this paper, we investigate the problem of efficient feature selection for cla... With the abundance of exceptionally High Dimensional data, feature selection has become an essential element in the Data Mining process. In this paper, we investigate the problem of efficient feature selection for classification on High Dimensional datasets. We present a novel filter based approach for feature selection that sorts out the features based on a score and then we measure the performance of four different Data Mining classification algorithms on the resulting data. In the proposed approach, we partition the sorted feature and search the important feature in forward manner as well as in reversed manner, while starting from first and last feature simultaneously in the sorted list. The proposed approach is highly scalable and effective as it parallelizes over both attribute and tuples simultaneously allowing us to evaluate many of potential features for High Dimensional datasets. The newly proposed framework for feature selection is experimentally shown to be very valuable with real and synthetic High Dimensional datasets which improve the precision of selected features. We have also tested it to measure classification accuracy against various feature selection process. 展开更多
关键词 high dimensional datasets feature selection classification Predominant feature
暂未订购
Effective and Efficient Feature Selection for Large-scale Data Using Bayes' Theorem 被引量:7
2
作者 Subramanian Appavu Alias Balamurugan Ramasamy Rajaram 《International Journal of Automation and computing》 EI 2009年第1期62-71,共10页
This paper proposes one method of feature selection by using Bayes' theorem. The purpose of the proposed method is to reduce the computational complexity and increase the classification accuracy of the selected featu... This paper proposes one method of feature selection by using Bayes' theorem. The purpose of the proposed method is to reduce the computational complexity and increase the classification accuracy of the selected feature subsets. The dependence between two attributes (binary) is determined based on the probabilities of their joint values that contribute to positive and negative classification decisions. If opposing sets of attribute values do not lead to opposing classification decisions (zero probability), then the two attributes are considered independent of each other, otherwise dependent, and one of them can be removed and thus the number of attributes is reduced. The process must be repeated on all combinations of attributes. The paper also evaluates the approach by comparing it with existing feature selection algorithms over 8 datasets from University of California, Irvine (UCI) machine learning databases. The proposed method shows better results in terms of number of selected features, classification accuracy, and running time than most existing algorithms. 展开更多
关键词 data mining classification feature selection dimensionality reduction Bayes' theorem.
在线阅读 下载PDF
A high‑dimensionality‑trait‑driven learning paradigm for high dimensional credit classification
3
作者 Lean Yu Lihang Yu Kaitao Yu 《Financial Innovation》 2021年第1期669-688,共20页
To solve the high-dimensionality issue and improve its accuracy in credit risk assessment,a high-dimensionality-trait-driven learning paradigm is proposed for feature extraction and classifier selection.The proposed p... To solve the high-dimensionality issue and improve its accuracy in credit risk assessment,a high-dimensionality-trait-driven learning paradigm is proposed for feature extraction and classifier selection.The proposed paradigm consists of three main stages:categorization of high dimensional data,high-dimensionality-trait-driven feature extraction,and high-dimensionality-trait-driven classifier selection.In the first stage,according to the definition of high-dimensionality and the relationship between sample size and feature dimensions,the high-dimensionality traits of credit dataset are further categorized into two types:100<feature dimensions<sample size,and feature dimensions≥sample size.In the second stage,some typical feature extraction methods are tested regarding the two categories of high dimensionality.In the final stage,four types of classifiers are performed to evaluate credit risk considering different high-dimensionality traits.For the purpose of illustration and verification,credit classification experiments are performed on two publicly available credit risk datasets,and the results show that the proposed high-dimensionality-trait-driven learning paradigm for feature extraction and classifier selection is effective in handling high-dimensional credit classification issues and improving credit classification accuracy relative to the benchmark models listed in this study. 展开更多
关键词 high dimensionality Trait-driven learning paradigm feature extraction Classifier selection Credit risk classification
在线阅读 下载PDF
基于DTW M的时序邻域特征选择算法
4
作者 杨璇 王潇婉 +1 位作者 胡灵芝 吴迪 《计算机应用研究》 北大核心 2026年第1期170-177,共8页
现实生活中广泛存在的高维时序数据常常具有决策属性且时间长度不等的特点,使得现有的邻域粗糙集特征选择算法不再适用或分类性能下降。为了解决该问题,提出了一种基于DTW M度量的高维时序数据的特征选择方法。首先,引入马氏距离定义高... 现实生活中广泛存在的高维时序数据常常具有决策属性且时间长度不等的特点,使得现有的邻域粗糙集特征选择算法不再适用或分类性能下降。为了解决该问题,提出了一种基于DTW M度量的高维时序数据的特征选择方法。首先,引入马氏距离定义高维动态时间扭曲距离(DTW M)用于度量属性间的相似性;接着定义了时序决策信息系统,用于存放非等长高维时序数据;提出基于DTW M距离度量的时序邻域关系和时序邻域粗糙集模型;最后通过定义内、外重要度,给出了属性依赖度作为筛选和提出属性的重要指标,进而提出了基于DTW M度量的高维时序数据的特征选择方法。通过五个公开数据集上的实验结果表明,所提算法较其他算法在分类精度上平均提升了14.2%和21.7%,充分证明了其有效性和优越性。 展开更多
关键词 特征选择 高维时序数据 DTW M度量 马氏距离 邻域粗糙集
在线阅读 下载PDF
Boosting方法在高维数据分析中的应用 被引量:3
5
作者 贾慧珣 刘晋 李康 《中国医院统计》 2011年第1期1-5,共5页
目的 随着现代基因组学、蛋白组学和代谢组学等研究兴起,产生了大量的高维组学数据.对高维组学数据的分析,其重要任务是对样品进行分类及筛选出具有生物学意义的特征标志物.本项研究针对这一问题,采用目前公认效果较好的Boosting方法进... 目的 随着现代基因组学、蛋白组学和代谢组学等研究兴起,产生了大量的高维组学数据.对高维组学数据的分析,其重要任务是对样品进行分类及筛选出具有生物学意义的特征标志物.本项研究针对这一问题,采用目前公认效果较好的Boosting方法进行高维数据分析,并探讨Boosting算法在高维数据研究中的应用条件和效果.方法 通过多次迭代,Boosting能够将基础弱分类器(决策树)形成优效分类器.模拟试验研究和验证了在含有大量无差异变量情况下对分类及变量重要性度量的效果,并通过实际基因表达数据进一步考核其应用效果.结果 模拟试验显示,应用Boosting方法与决策树所建的组合模型对分类具有较高的准确性,并对噪声变量的干扰具有一定的抵抗能力.分类的同时能够对变量的重要性进行有效的评价;在保留了所有基因的情况下,对结肠癌真实基因表达数据的分类效果甚为理想,并为医学研究中结肠癌致病基因的发现提供了线索.结论 基于决策树所构造的Boosting组合分类模型,可以有效地应用于高维数据的判别分类及变量重要性评价的问题.Boosting算法在解决小样本、多噪声的高维问题中表现出许多潜在的优势,与目前使用的其他方法相比,对于具有复杂结构高维数据,Boosting算法有其明显的自身特点,如运算速度快,适用性更强,软件实现相对容易等,是一种值得推荐和进一步研究的方法. 展开更多
关键词 boosting 高维数据 分类研究 特征筛选
暂未订购
Feature Screening for Ultrahigh-dimensional Censored Data with Varying Coefficient Single-index Model 被引量:1
6
作者 Yi LIU 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 2019年第4期845-861,共17页
In this paper, we study the sure independence screening of ultrahigh-dimensional censored data with varying coefficient single-index model. This general model framework covers a large number of commonly used survival ... In this paper, we study the sure independence screening of ultrahigh-dimensional censored data with varying coefficient single-index model. This general model framework covers a large number of commonly used survival models. The property that the proposed method is not derived for a specific model is appealing in ultrahigh dimensional regressions, as it is difficult to specify a correct model for ultrahigh dimensional predictors.Once the assuming data generating process does not meet the actual one, the screening method based on the model will be problematic. We establish the sure screening property and consistency in ranking property of the proposed method. Simulations are conducted to study the finite sample performances, and the results demonstrate that the proposed method is competitive compared with the existing methods. We also illustrate the results via the analysis of data from The National Alzheimers Coordinating Center(NACC). 展开更多
关键词 censored data consistency in ranking PROPERTY feature selection high-dimensional data sure SCREENING PROPERTY VARYING COEFFICIENT single-index model
原文传递
Regulatory Genes Through Robust-SNR for Binary Classification Within Functional Genomics Experiments
7
作者 Muhammad Hamraz Dost Muhammad Khan +6 位作者 Naz Gul Amjad Ali Zardad Khan Shafiq Ahmad Mejdal Alqahtani Akber Abid Gardezi Muhammad Shafiq 《Computers, Materials & Continua》 SCIE EI 2023年第2期3663-3677,共15页
The current study proposes a novel technique for feature selection by inculcating robustness in the conventional Signal to noise Ratio(SNR).The proposed method utilizes the robust measures of location i.e.,the“Median... The current study proposes a novel technique for feature selection by inculcating robustness in the conventional Signal to noise Ratio(SNR).The proposed method utilizes the robust measures of location i.e.,the“Median”as well as the measures of variation i.e.,“Median absolute deviation(MAD)and Interquartile range(IQR)”in the SNR.By this way,two independent robust signal-to-noise ratios have been proposed.The proposed method selects the most informative genes/features by combining the minimum subset of genes or features obtained via the greedy search approach with top-ranked genes selected through the robust signal-to-noise ratio(RSNR).The results obtained via the proposed method are compared with wellknown gene/feature selection methods on the basis of performance metric i.e.,classification error rate.A total of 5 gene expression datasets have been used in this study.Different subsets of informative genes are selected by the proposed and all the other methods included in the study,and their efficacy in terms of classification is investigated by using the classifier models such as support vector machine(SVM),Random forest(RF)and k-nearest neighbors(k-NN).The results of the analysis reveal that the proposed method(RSNR)produces minimum error rates than all the other competing feature selection methods in majority of the cases.For further assessment of the method,a detailed simulation study is also conducted. 展开更多
关键词 Median absolute deviation(MAD) classification feature selection high dimensional gene expression datasets signal to noise ratio
在线阅读 下载PDF
面向不平衡医疗数据的多阶段混合特征选择算法 被引量:3
8
作者 刘佳璇 李代伟 +3 位作者 任李娟 张海清 陈金京 杨瑞 《计算机工程与应用》 北大核心 2025年第2期158-169,共12页
为解决医疗数据中存在的特征高维和类别不平衡问题,在基于简单、快速和有效高维特征选择算法SFE(simple,fast and effective high-dimensional feature selection)的基础上,提出了一种面向不平衡医疗数据的多阶段混合特征选择算法HFSIM(... 为解决医疗数据中存在的特征高维和类别不平衡问题,在基于简单、快速和有效高维特征选择算法SFE(simple,fast and effective high-dimensional feature selection)的基础上,提出了一种面向不平衡医疗数据的多阶段混合特征选择算法HFSIM(hybrid feature selection for imbalanced medical data)。HFSIM算法采用改进的自适应边界SMOTE过采样技术,生成符合边界条件的新少数类实例以解决医学数据中类不平衡问题。同时,为了改善搜索空间多样性不足的问题,优化了SFE算法中的非选择操作符率参数UR(unselected rate),有效避免了算法过早收敛及易陷入局部最优的问题。将过滤式Fisher Score方法与优化UR参数后的算法有效结合,使算法能以较低的计算成本获得较好寻优能力。经实验验证,相比于SFE算法,HFSIM算法在Ovarian数据集上准确率达到99.67%,提升了2.11个百分点,G-means和F1分别提升了5.13和2.30个百分点。此外,通过对比特征数量和运行时间,证明了HFSIM算法既能保证算法精度又有效降低了计算成本。 展开更多
关键词 高维不平衡 特征选择 多阶段混合 医疗数据
在线阅读 下载PDF
基于改进Apriori的网络高维数据关联特征挖掘
9
作者 王灵 侯春明 《现代电子技术》 北大核心 2025年第24期67-71,共5页
为可靠挖掘具有维度高、倍增特点且呈稀疏分布的网络数据之间的关联特征,提出一种基于改进Apriori的网络高维数据关联特征挖掘方法。采用Boruta算法在原始网络高维数据中筛选出最具有代表性的特征,并有效处理其中的冗余特征数据;通过K... 为可靠挖掘具有维度高、倍增特点且呈稀疏分布的网络数据之间的关联特征,提出一种基于改进Apriori的网络高维数据关联特征挖掘方法。采用Boruta算法在原始网络高维数据中筛选出最具有代表性的特征,并有效处理其中的冗余特征数据;通过K最近邻插补子空间聚类算法插补选择的特征数据,以提升特征数据的完整性和连续性;利用改进Apriori算法挖掘插补后的特征数据集,结合关联规则支持度、置信度和提升度的计算结果确定多个关联规则强度,更好地判断特征之间的关联程度,实现网络高维数据关联特征的挖掘。测试结果表明:所提方法具有较好的特征选择能力,归一化互信息结果均在0.909以上,特征冗余程度均低于0.0155;且能够较好地实现缺失特征插补处理,并依据设定阈值范围完成网络高维数据关联特征挖掘。 展开更多
关键词 高维数据 关联特征挖掘 数据插补 APRIORI算法 Boruta算法 特征选择
在线阅读 下载PDF
基于不相关回归和自适应谱图的多标签学习特征选择方法
10
作者 王艳红 顾建伟 +3 位作者 栾卫平 张睿 黄征 王达琳 《计算机应用与软件》 北大核心 2025年第3期298-310,391,共14页
为解决特征的冗余性问题,提出一种基于不相关回归和自适应谱图的多标签学习特征选择方法。利用具有不相关约束的回归模型来生成低冗余但有区别的特征子集,从而同时进行流形学习和特征选择;在流形框架中引入基于信息熵的谱图项,以保持后... 为解决特征的冗余性问题,提出一种基于不相关回归和自适应谱图的多标签学习特征选择方法。利用具有不相关约束的回归模型来生成低冗余但有区别的特征子集,从而同时进行流形学习和特征选择;在流形框架中引入基于信息熵的谱图项,以保持后续学习过程中数据的局部几何结构;在多个公共多标签数据集上进行综合实验,结果表明该方法能够高效和准确地实现高维数据特征选择。 展开更多
关键词 特征选择 高维数据 流形框架 信息熵
在线阅读 下载PDF
基于双变异布谷鸟搜索的高维医学数据特征选择方法
11
作者 王彬 王前 +2 位作者 包春梅 陈望 王林 《合肥师范学院学报》 2025年第2期98-102,共5页
近年来,医学数据的指数量级增加导致越来越多的冗余数据被储存起来,这些冗余数据不仅占用资源,处理起来也十分耗费时间。作者提出了一种基于双变异机制的布谷鸟搜索算法(DMCS),用于解决高维医学数据的特征选择问题。首先,将随机生成的... 近年来,医学数据的指数量级增加导致越来越多的冗余数据被储存起来,这些冗余数据不仅占用资源,处理起来也十分耗费时间。作者提出了一种基于双变异机制的布谷鸟搜索算法(DMCS),用于解决高维医学数据的特征选择问题。首先,将随机生成的初始化种群编码为二进制,采用0和1这两个数值来对特征的选取进行有效的度量;然后提出了一种双变异机制,该机制基于CS算法充分融合了粒子群变异和差分变异,使得种群在迭代后期能够保存种群多样性;最后证明了DMCS算法在10个高维医学数据上的有效性,并且DMCS在选择特征子集、分类精确度上均优于五种先进的特征提取方法,这表明提出的算法在解决高维医学数据特征选择问题上是十分有效的,能够在更小的特征子集下具有更高的分类精度. 展开更多
关键词 特征选择 布谷鸟搜索 双变异机制 高维数据 分类
在线阅读 下载PDF
A new distributed feature selection technique for classifying gene expression data
12
作者 Sarah M.Ayyad Ahmed I.Saleh Labib M.Labib 《International Journal of Biomathematics》 SCIE 2019年第4期79-109,共31页
Classification of gene expression data is a pivotal research area that plays a substantial role in diagnosis and prediction of diseases. Generally, feature selection is one of the extensively used techniques in data m... Classification of gene expression data is a pivotal research area that plays a substantial role in diagnosis and prediction of diseases. Generally, feature selection is one of the extensively used techniques in data mining approaches, especially in classification. Gene expression data are usually composed of dozens of samples characterized by thousands of genes. This increases the dimensionality coupled with the existence of irrelevant and redundant features. Accordingly, the selection of informative genes (features) becomes difficult, which badly affects the gene classification accuracy. In this paper, we consider the feature selection for classifying gene expression microarray datasets. The goal is to detect the most possibly cancer-related genes in a distributed manner, which helps in effectively classifying the samples. Initially, the available huge amount of considered features are subdivided and distributed among several processors. Then, a new filter selection method based on a fuzzy inference system is applied to each subset of the dataset. Finally, all the resulted features are ranked, then a wrapper-based selection method is applied. Experimental results showed that our proposed feature selection technique performs better than other techniques since it produces lower time latency and improves classification performance. 展开更多
关键词 feature selection gene expression dimensionality reduction MICROARRAY data classification DISTRIBUTED learning Mathematics SUBJECT classification
原文传递
特征选择稳定性研究综述 被引量:41
13
作者 刘艺 曹建军 +1 位作者 刁兴春 周星 《软件学报》 EI CSCD 北大核心 2018年第9期2559-2579,共21页
随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动... 随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动具有一定鲁棒性.提高特征选择稳定性有助于发现相关特征,增强特征可信度,进一步降低开销.在回顾现有特征选择稳定性提升方法的基础上对其进行分类,分析比较各类方法的特点和适用范围,总结特征选择稳定性中的相关评估工作,并通过实验剖析其中稳定性度量指标的性能,进而对比4种集成方法的效用.最后讨论当前工作的局限性,指出未来的研究方向. 展开更多
关键词 高维数据 特征选择 稳定性 稳定性指标 集成选择 演化算法
在线阅读 下载PDF
基于归一化互信息的FCBF特征选择算法 被引量:21
14
作者 段宏湘 张秋余 张墨逸 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第1期52-56,共5页
针对高维数据中不相关特征、冗余特征等导致的分类任务计算量大、分类正确率低等问题,提出了一种基于归一化互信息的相关性快速过滤特征选择(FCBF-NMI)算法.该算法采用归一化互信息代替对称不确定性作为FCBF算法的相关性评价标准,进行... 针对高维数据中不相关特征、冗余特征等导致的分类任务计算量大、分类正确率低等问题,提出了一种基于归一化互信息的相关性快速过滤特征选择(FCBF-NMI)算法.该算法采用归一化互信息代替对称不确定性作为FCBF算法的相关性评价标准,进行特征与类别、特征与特征的相关性分析,删除不相关特征及冗余特征以获得最优特征子集.实验结果表明:FCBF-NMI算法得到的最优特征子集更合理,平均分类正确率为89.68%,所用时间平均低至2.64s. 展开更多
关键词 高维数据 特征选择 归一化互信息 相关性快速过滤特征选择(FCBF) 分类
原文传递
基于随机森林的不平衡特征选择算法 被引量:34
15
作者 尹华 胡玉平 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期59-65,共7页
数据高维不平衡是当前数据挖掘的挑战。针对传统特征选择方法基于类别平衡假设,导致在不平衡数据上效果不理想的问题,利用随机森林内嵌的变量选择机制,构造了一个新的不平衡随机森林特征选择算法IBRFVS。IBRFVS在平衡的取样数据上构造... 数据高维不平衡是当前数据挖掘的挑战。针对传统特征选择方法基于类别平衡假设,导致在不平衡数据上效果不理想的问题,利用随机森林内嵌的变量选择机制,构造了一个新的不平衡随机森林特征选择算法IBRFVS。IBRFVS在平衡的取样数据上构造多样决策树,采用交叉验证方式获取单棵决策树的特征重要性度量值。各决策树的权重和特征重要性度量的加权平均决定了最终的特征重要性序列,其中,决策树的权重由该决策树与集成预测的一致性程度决定。在UCI数据集上的随机森林超参数选择和预处理对比验证实验中显示,四种超参数K经验取值中,当K的取值为特征数的平方根时,IBRFVS性能较为稳定且优于传统特征选择算法。 展开更多
关键词 不平衡数据 高维数据 特征选择 随机森林
在线阅读 下载PDF
高维数据挖掘中基于中位数回归的特征提取新方法 被引量:9
16
作者 李泽安 陈建平 赵为华 《计算机应用研究》 CSCD 北大核心 2013年第2期374-376,413,共4页
为降低噪声对数据特征提取(变量选择)效果的不利影响,基于中位数回归分析方法,利用变量选择降维技术(正则化估计),提出了一种稳健、有效的特征提取(变量选择)新方法,并具体给出了估计算法,该算法具有快速计算的特点。实验结果表明,新方... 为降低噪声对数据特征提取(变量选择)效果的不利影响,基于中位数回归分析方法,利用变量选择降维技术(正则化估计),提出了一种稳健、有效的特征提取(变量选择)新方法,并具体给出了估计算法,该算法具有快速计算的特点。实验结果表明,新方法能够有效地对高维数据集进行估计和变量选择,且具有较高的准确性,即使数据中的信噪比很低时,该方法仍具有较好的效果。因此,该方法为高维数据挖掘特征提取提供了稳健且有效的方法。 展开更多
关键词 高维数据 特征提取 变量选择 中位数回归 LASSO
在线阅读 下载PDF
基于SS/OSF实现高维稀疏数据对象的聚类 被引量:5
17
作者 吴萍 宋瀚涛 +2 位作者 牛振东 张利萍 张聚礼 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第3期216-220,共5页
为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据... 为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据聚类结果中各个对象集合的上确界和下确界为新对象进行对象组分类.实验表明,与传统K-means聚类方法相比,随着数据对象数目的增加,该方法无论是在运行时间上,还是在聚类结果的准确度方面都有明显的改进. 展开更多
关键词 高维稀疏二态数据 对象组相似度 对象组特征向量 聚类 分类
在线阅读 下载PDF
高维小样本分类问题中特征选择研究综述 被引量:40
18
作者 王翔 胡学钢 《计算机应用》 CSCD 北大核心 2017年第9期2433-2438,2448,共7页
随着生物信息学、基因表达谱微阵列、图像识别等技术的发展,高维小样本分类问题成为数据挖掘(包括机器学习、模式识别)中的一项挑战性任务,容易引发"维数灾难"和过拟合问题。针对这个问题,特征选择可以有效避免维数灾难,提升... 随着生物信息学、基因表达谱微阵列、图像识别等技术的发展,高维小样本分类问题成为数据挖掘(包括机器学习、模式识别)中的一项挑战性任务,容易引发"维数灾难"和过拟合问题。针对这个问题,特征选择可以有效避免维数灾难,提升分类模型泛化能力,成为研究的热点,有必要对国内外高维小样本特征选择主要研究情况进行综述。首先分析了高维小样本特征选择问题的本质;其次,根据其算法的本质区别,重点对高维小样本数据的特征选择方法进行分类剖析和比较;最后对高维小样本特征选择研究面临的挑战以及研究方向作了展望。 展开更多
关键词 特征选择 高维数据 小样本学习 信息过滤 支持向量机
在线阅读 下载PDF
一种基于投影的特征选择方法 被引量:4
19
作者 张瀚文 刘剑 +1 位作者 张妙恬 孟国营 《工矿自动化》 北大核心 2014年第1期63-67,共5页
以轴承故障诊断为应用背景,基于低维投影能够反映原高维数据某些特征的思想,提出了一种基于投影的特征选择方法。该方法利用遗传算法找到最能反映样本分类特性的投影方向,并利用该方向剔除与投影值无关的特征指标,克服了传统特征选择方... 以轴承故障诊断为应用背景,基于低维投影能够反映原高维数据某些特征的思想,提出了一种基于投影的特征选择方法。该方法利用遗传算法找到最能反映样本分类特性的投影方向,并利用该方向剔除与投影值无关的特征指标,克服了传统特征选择方法在高维空间中计算复杂的缺点,有效避免了"维数灾难"。仿真结果表明,该方法能够在不降低投影值类别特性的情况下,有效降低样本数据维数,完成特征选择,提高了分类效率及准确率。 展开更多
关键词 轴承故障诊断 特征选择 低维投影 高维数据 遗传算法
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部