期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
SMOTE和Biased-SVM相结合的不平衡数据分类方法
被引量:
16
1
作者
王和勇
樊泓坤
姚正安
《计算机科学》
CSCD
北大核心
2008年第5期174-176,共3页
针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使...
针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类。实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度。
展开更多
关键词
机器学习
不平衡数据
数据分类
SMOTE
bias
ed-SVM
在线阅读
下载PDF
职称材料
基于ν-SVM的不平衡数据挖掘研究
被引量:
8
2
作者
郑恩辉
许宏
+1 位作者
李平
宋执环
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006年第10期1682-1687,共6页
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些...
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.
展开更多
关键词
不平衡数据
有偏分类器
支持向量机
在线阅读
下载PDF
职称材料
不平衡数据知识挖掘:类分布对支持向量机分类的影响
被引量:
17
3
作者
郑恩辉
李平
宋执环
《信息与控制》
CSCD
北大核心
2005年第6期703-708,共6页
基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和...
基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和结论的正确性.*
展开更多
关键词
不平衡数据
有偏分类器
支持向量机
在线阅读
下载PDF
职称材料
一种基于密度偏差抽样的孤立点检测算法
被引量:
3
4
作者
余建桥
葛继科
李娅
《计算机科学》
CSCD
北大核心
2004年第10期206-208,共3页
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法...
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的。
展开更多
关键词
孤立点
检测算法
数据约简
大规模数据
知识发现
点检
识别
样本数据
区域
抽样
在线阅读
下载PDF
职称材料
转子故障特征数据分类的KPCA-BFDA方法
被引量:
6
5
作者
马再超
赵荣珍
杨文瑛
《振动.测试与诊断》
EI
CSCD
北大核心
2013年第2期192-198,334-335,共7页
对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判...
对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判别分析法相结合的数据集降维方法,该方法中的核主成分分析步骤用于构造剔除数据集冗余信息的降维数据集,偏费歇判别分析步骤用于进一步降低数据集维数并提高不同类别数据子集间的分离程度。对实例数据与典型故障数据的分类结果表明,提出的偏费歇判别分析法在具备费歇判别分析降维可分性能的基础上,具有更低计算复杂度的特点。提出的核主成分分析结合偏费歇判别分析的算法,其对应的降维结果能直接应用于线性分类器,且取得了较好的分类效果。
展开更多
关键词
故障特征数据集
数据分类
偏费歇判别分析
核主成分分析
在线阅读
下载PDF
职称材料
面向不均衡数据的融合谱聚类的自适应过采样法
被引量:
9
6
作者
刘金平
周嘉铭
+3 位作者
贺俊宾
唐朝晖
徐鹏飞
张国勇
《智能系统学报》
CSCD
北大核心
2020年第4期732-739,共8页
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导...
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,结果表明,所提方法能有效解决数据的不均衡问题,使得分类器对于少数类样本的分类精度得到提升。
展开更多
关键词
不自适应综合采样法
不均衡数据集
谱聚类
过采样
模式分类
数据分布
有偏分类器
数据预处理
在线阅读
下载PDF
职称材料
题名
SMOTE和Biased-SVM相结合的不平衡数据分类方法
被引量:
16
1
作者
王和勇
樊泓坤
姚正安
机构
华南理工大学电子商务学院
中山大学数学与计算科学学院
出处
《计算机科学》
CSCD
北大核心
2008年第5期174-176,共3页
文摘
针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类。实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度。
关键词
机器学习
不平衡数据
数据分类
SMOTE
bias
ed-SVM
Keywords
Machine learning, Imbalanced
data
set
,
data
classification, SMOTE,
bias
ed-SVM
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
S512.103.7 [农业科学—作物学]
在线阅读
下载PDF
职称材料
题名
基于ν-SVM的不平衡数据挖掘研究
被引量:
8
2
作者
郑恩辉
许宏
李平
宋执环
机构
中国计量学院机电工程学院
浙江大学工业控制技术国家重点实验室
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006年第10期1682-1687,共6页
基金
国家"863"高科技研究发展计划资助项目(2002AA412010-12)
文摘
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.
关键词
不平衡数据
有偏分类器
支持向量机
Keywords
unbalanced
data
set
bias
ed classifier
support vector machines
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
不平衡数据知识挖掘:类分布对支持向量机分类的影响
被引量:
17
3
作者
郑恩辉
李平
宋执环
机构
浙江大学工业控制技术国家重点实验室
出处
《信息与控制》
CSCD
北大核心
2005年第6期703-708,共6页
文摘
基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和结论的正确性.*
关键词
不平衡数据
有偏分类器
支持向量机
Keywords
unbalanced
data
set
bias
ed classifier
support vector machine (SVM)
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种基于密度偏差抽样的孤立点检测算法
被引量:
3
4
作者
余建桥
葛继科
李娅
机构
西南农业大学信息学院
出处
《计算机科学》
CSCD
北大核心
2004年第10期206-208,共3页
基金
重庆市教委资助项目(030201)
文摘
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的。
关键词
孤立点
检测算法
数据约简
大规模数据
知识发现
点检
识别
样本数据
区域
抽样
Keywords
Large
data
set
,
bias
ed sampling, Outlier detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
转子故障特征数据分类的KPCA-BFDA方法
被引量:
6
5
作者
马再超
赵荣珍
杨文瑛
机构
兰州理工大学数字制造技术与应用省部共建教育部重点实验室
兰州理工大学机电工程学院
出处
《振动.测试与诊断》
EI
CSCD
北大核心
2013年第2期192-198,334-335,共7页
基金
国家自然科学基金资助项目(50875118
51165019)
甘肃省教育厅硕导基金资助项目(0903-11)
文摘
对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判别分析法相结合的数据集降维方法,该方法中的核主成分分析步骤用于构造剔除数据集冗余信息的降维数据集,偏费歇判别分析步骤用于进一步降低数据集维数并提高不同类别数据子集间的分离程度。对实例数据与典型故障数据的分类结果表明,提出的偏费歇判别分析法在具备费歇判别分析降维可分性能的基础上,具有更低计算复杂度的特点。提出的核主成分分析结合偏费歇判别分析的算法,其对应的降维结果能直接应用于线性分类器,且取得了较好的分类效果。
关键词
故障特征数据集
数据分类
偏费歇判别分析
核主成分分析
Keywords
feature
data
set
,
data
classification,
bias
ed fisher discriminatory analysis(BFDA),kernel principal component analysis(KPCA)
分类号
TH165 [机械工程—机械制造及自动化]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
面向不均衡数据的融合谱聚类的自适应过采样法
被引量:
9
6
作者
刘金平
周嘉铭
贺俊宾
唐朝晖
徐鹏飞
张国勇
机构
晓庄学院智能计算与语言信息处理湖南省重点实验室
湖南省计量检测研究院
中南大学自动化学院
出处
《智能系统学报》
CSCD
北大核心
2020年第4期732-739,共8页
基金
国家自然科学基金项目(61971188,61771492)
国家自然科学基金−广东联合基金重点项目(U1701261)
+1 种基金
湖南省自然科学基金项目(2018JJ3349)
湖南省研究生科研创新项目(CX20190415)。
文摘
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,结果表明,所提方法能有效解决数据的不均衡问题,使得分类器对于少数类样本的分类精度得到提升。
关键词
不自适应综合采样法
不均衡数据集
谱聚类
过采样
模式分类
数据分布
有偏分类器
数据预处理
Keywords
adaptive synthetic sampling approach(ADASYN)
imbalanced
data
set
spectral clustering
oversampling
pattern classification
data
distribution
bias
ed classifier
data
pre-processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
SMOTE和Biased-SVM相结合的不平衡数据分类方法
王和勇
樊泓坤
姚正安
《计算机科学》
CSCD
北大核心
2008
16
在线阅读
下载PDF
职称材料
2
基于ν-SVM的不平衡数据挖掘研究
郑恩辉
许宏
李平
宋执环
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006
8
在线阅读
下载PDF
职称材料
3
不平衡数据知识挖掘:类分布对支持向量机分类的影响
郑恩辉
李平
宋执环
《信息与控制》
CSCD
北大核心
2005
17
在线阅读
下载PDF
职称材料
4
一种基于密度偏差抽样的孤立点检测算法
余建桥
葛继科
李娅
《计算机科学》
CSCD
北大核心
2004
3
在线阅读
下载PDF
职称材料
5
转子故障特征数据分类的KPCA-BFDA方法
马再超
赵荣珍
杨文瑛
《振动.测试与诊断》
EI
CSCD
北大核心
2013
6
在线阅读
下载PDF
职称材料
6
面向不均衡数据的融合谱聚类的自适应过采样法
刘金平
周嘉铭
贺俊宾
唐朝晖
徐鹏飞
张国勇
《智能系统学报》
CSCD
北大核心
2020
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部