期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
SMOTE和Biased-SVM相结合的不平衡数据分类方法 被引量:16
1
作者 王和勇 樊泓坤 姚正安 《计算机科学》 CSCD 北大核心 2008年第5期174-176,共3页
针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使... 针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类。实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度。 展开更多
关键词 机器学习 不平衡数据 数据分类 SMOTE biased-SVM
在线阅读 下载PDF
基于ν-SVM的不平衡数据挖掘研究 被引量:8
2
作者 郑恩辉 许宏 +1 位作者 李平 宋执环 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第10期1682-1687,共6页
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些... 针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性. 展开更多
关键词 不平衡数据 有偏分类器 支持向量机
在线阅读 下载PDF
不平衡数据知识挖掘:类分布对支持向量机分类的影响 被引量:17
3
作者 郑恩辉 李平 宋执环 《信息与控制》 CSCD 北大核心 2005年第6期703-708,共6页
基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和... 基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和结论的正确性.* 展开更多
关键词 不平衡数据 有偏分类器 支持向量机
在线阅读 下载PDF
一种基于密度偏差抽样的孤立点检测算法 被引量:3
4
作者 余建桥 葛继科 李娅 《计算机科学》 CSCD 北大核心 2004年第10期206-208,共3页
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法... 孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的。 展开更多
关键词 孤立点 检测算法 数据约简 大规模数据 知识发现 点检 识别 样本数据 区域 抽样
在线阅读 下载PDF
转子故障特征数据分类的KPCA-BFDA方法 被引量:6
5
作者 马再超 赵荣珍 杨文瑛 《振动.测试与诊断》 EI CSCD 北大核心 2013年第2期192-198,334-335,共7页
对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判... 对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判别分析法相结合的数据集降维方法,该方法中的核主成分分析步骤用于构造剔除数据集冗余信息的降维数据集,偏费歇判别分析步骤用于进一步降低数据集维数并提高不同类别数据子集间的分离程度。对实例数据与典型故障数据的分类结果表明,提出的偏费歇判别分析法在具备费歇判别分析降维可分性能的基础上,具有更低计算复杂度的特点。提出的核主成分分析结合偏费歇判别分析的算法,其对应的降维结果能直接应用于线性分类器,且取得了较好的分类效果。 展开更多
关键词 故障特征数据集 数据分类 偏费歇判别分析 核主成分分析
在线阅读 下载PDF
面向不均衡数据的融合谱聚类的自适应过采样法 被引量:9
6
作者 刘金平 周嘉铭 +3 位作者 贺俊宾 唐朝晖 徐鹏飞 张国勇 《智能系统学报》 CSCD 北大核心 2020年第4期732-739,共8页
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导... 分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,结果表明,所提方法能有效解决数据的不均衡问题,使得分类器对于少数类样本的分类精度得到提升。 展开更多
关键词 不自适应综合采样法 不均衡数据集 谱聚类 过采样 模式分类 数据分布 有偏分类器 数据预处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部