基于样本差异度的SVM训练样本缩减算法被引量：6

Algorithm for reduction SVM training sample based on sample dissimilarity

下载PDF

导出

摘要为了对大规模训练样本进行缩减,提出了k近邻向量,给出了一种新的样本差异度的计量方法,证明了该差异度关于噪声识别和类边界距离的几个性质。依据此性质提出了一个高效的SVM训练样本缩减算法,算法首先根据样本差异度的性质剔除噪声样本,然后用类间差异度近似表示类边界距离,结合样本相似性,直接从原始样本空间剔除次要的训练样本。仿真结果表明,减样算法可以有效缩减样本,提高训练效率。 To reduce large-scale training sample set, the concept of k-nearest vectors is proposed, and a new account method for dissimilarity is given accordingly. Then, the paper proposes and proves the methods of noise identification and boundaries distance description. Based on these methods, an efficient sample reduction algorithm is proposed. The algorithm removes noise samples according to the dissimilarity at first step, then according to the similarity of samples, and the dissimilarity which describes the distance between sample and classification boundary, the algorithm removes minor training samples from the original sample space directly. Experiments indicate that the reduction algorithm can effectively reduce the sample, and improve the training efficiency.

作者陈圣兵王晓峰

机构地区合肥学院计算机科学与技术系网络与智能信息处理重点实验室中国科学院合肥智能机械研究所智能计算实验室

出处《计算机工程与应用》 CSCD 2012年第7期20-22,共3页 Computer Engineering and Applications

基金国家自然科学基金(No.61005010) 安徽省高校省级自然基金(No.KJ2012B149) 合肥学院人才科研基金(No.11RC06)

关键词大规模样本集减样去噪支持向量机样本差异度 large-scale sample set samples reduction de-noising support vector machine sample dissimilarity

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1Lina H J, Yeh J EOptimal reduction of solutions for support vector machines[J].Applied Mathematics and Computation,2009, 214(2) :329-335.
2李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
3Chan Guangxi, Xu Jian, Xiang Xiaolin.Neighborhood preprocessing SVM for large-scale data sets classification[C]//Fifth International Conference on Fuzzy Systems and Knowledge Discovery, Shandong, 2008,2: 245-249.
4Wang Jigang, Neskovic P, Cooper L N.Training data selection for support vector machines[C]//lst International Conference on Advances in Natural Computation,ICNC,2005:554-564.
5罗瑜,易文德,王丹琛,何大可.大规模数据集下支持向量机训练样本的缩减策略[J].计算机科学,2007,34(10):211-213. 被引量：13
6刘万里,刘三阳,薛贞霞.基于距离核函数的除噪和减样方法[J].系统工程理论与实践,2008,28(7):160-164. 被引量：5
7Li Yuangui,Hu Zhonghui, Cai Yunze, et al.Support vector based prototype selection method for nearest neighbor rules[C]//Lectute Notes in Computer Science 3610: ICNC.Berlin: Springer, 2005: 528-535.
8Zhang Ling, Zhang Bo.Relational between support vector set and kernel functions in SVM[J].Joumal of Computer Science & Technology,2002,17(5) :549-555.
9李永丽,任辉明,董立岩,李威,陈思国,赵宇.基于数据模式聚类算法的离群点检测[J].吉林大学学报（理学版）,2007,45(3):435-437. 被引量：3

二级参考文献31

1李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
2Hearst M.A., Dumais S.T., Osman E., Platt J., Scholkopf B.. Support vector machines. IEEE Intelligent Systems, 1998, 13(4): 18～28
3Vapnik V.N.. An overview of statistical learning theory. IEEE Transactions on Neural Networks, 1999, 10(5): 988～999
4Vapnik V.N.. Statistical Learning Theory.2nd ed..New York: Springer-Verlag, 1999
5Müller Klaus-Robert, Mika Sebastian, Rtsch Gunnar, Tsuda Koji, Schlkopf Bernhard. An introduction to kernel-based learning algorithms. IEEE Transactions on Neural Networks, 2001, 12(2): 181～201
6Burges C.J.C.. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2): 121～167
7Ke Hai-Xin,Zhang Xue -Gong.Editing support vector machines. In: Proceedings of the International Joint Conference on Neural Networks, Washington, DC, 2001, 2: 1464～1467
8Charu C A,Philip S Y.Outlier Detection for High Dimensional Data[C]//Proceedings of the ACM Sigmod International Conference on Management of Data.Santa Barbara,CA:ACM Press,2001:37-47.
9Edwin M K,Raymond T N,Vladimir Tucakov.Distance-based Outliers:Algorithms and Applications[J].VLDB Journal,2000,324(8):237-253.
10VapnikVN．统计学习理论的本质[M]．清华大学出版社，2000

共引文献67

1胡正平.基于模糊K近邻决策的柔性SVM分类算法[J].仪器仪表学报,2005,26(z2):384-386. 被引量：2
2李学勇,高国红,孙甲霞.基于互信息和K-means聚类的信息安全风险评估[J].河南师范大学学报（自然科学版）,2011,39(2):152-155.
3郑春颖.一种改进的SVM算法[J].航空计算技术,2005,35(2):6-8. 被引量：6
4潘晨,闫相国,郑崇勋,杨勇.用于彩色图像分割的支持向量机的快速训练[J].模式识别与人工智能,2005,18(4):392-398. 被引量：5
5林杨,刘贵全,杨立身.异常检测中的改进SVM方法[J].信息安全与通信保密,2006,28(12):139-141.
6孟海涛,刘鹏.一种改进的SVM支持向量分类方法[J].现代电子技术,2007,30(1):150-152. 被引量：2
7刘鹏,孟海涛,陈笑蓉.一种提高SVM分类速度和泛化性的新方法[J].贵州大学学报（自然科学版）,2007,24(1):50-53. 被引量：1
8胡正平,张晔.结构风险最小化近邻分析解决大规模训练集支持向量机学习问题[J].信号处理,2007,23(2):161-164. 被引量：3
9方景龙,陈铄,潘志庚,梁荣华.复杂分类问题支持向量机的简化[J].电子学报,2007,35(5):858-861. 被引量：10
10林杨,刘贵全,杨立身.基于改进SVM方法的入侵检测[J].计算机工程,2007,33(14):151-153. 被引量：8

同被引文献58

1雷绍兰,孙才新,周湶,张晓星.电力短期负荷的多变量时间序列线性回归预测方法研究[J].中国电机工程学报,2006,26(2):25-29. 被引量：96
2葛海峰,林继鹏,刘君华,丁晖.基于支持向量机和小波分解的气体识别研究[J].仪器仪表学报,2006,27(6):573-578. 被引量：13
3高建良,徐勇军,李晓维.基于加权中值的分布式传感器网络故障检测(英文)[J].软件学报,2007,18(5):1208-1217. 被引量：39
4VAPNIK V N.统计学习理论[M].许建华,张学工,译.北京:电子工业出版社,2004.
5Shi B, Li Y X, Yu X H, et al.A modified particle swarm optimization and radial basis function neural network hybrid algorithm model and its application[C]~~2009 WRI Global Congress on Intelligent Systems, 2009,1 : 134-138.
6Wang H,Li B S,Han X Y,et al.Study of neural networks for electric power load forecasting[C]//The 3rd International Symposium on Neural Networks,2010: 1277-1283.
7Chuang Li-Yeh, Tsai Sheng-Wei, Yang Cheng-hong.Chaotic catfish particle swarm optimization for solving global numeri- cal optimization problems[J].Applied Mathematics and Com- putation, 2011,217 : 6900-6916.
8Shi B, Li Y X, Yu X H, et al.A modified particle swarm optimization and radial basis function neural network hybrid algorithm model and its application[C]~~2009 WRI Global Congress on Intelligent Systems, 2009,1 : 134-138.
9Wang H,Li B S,Han X Y,et al.Study of neural networks for electric power load forecasting[C]//The 3rd International Symposium on Neural Networks,2010: 1277-1283.
10Chuang Li-Yeh, Tsai Sheng-Wei, Yang Cheng-hong.Chaotic catfish particle swarm optimization for solving global numeri- cal optimization problems[J].Applied Mathematics and Com- putation, 2011,217 : 6900-6916.

引证文献6

1李勇,梁志贞,夏士雄.基于L_p范数的2DPCA的人脸识别方法[J].计算机工程与应用,2013,49(11):183-186. 被引量：3
2石晓艳,刘淮霞,于水娟.鲶鱼粒子群算法优化支持向量机的短期负荷预测[J].计算机工程与应用,2013,49(11):220-223. 被引量：10
3李琼,陈利,王维虎.基于SVM的手写体数字快速识别方法研究[J].计算机技术与发展,2014,24(2):205-208. 被引量：19
4彭能松,张维纬,张育钊,黄焯,郑力新.基于时间序列数据的无线传感器网络的异常检测方法[J].传感技术学报,2018,31(4):595-601. 被引量：24
5毕傲睿,骆正山,乔伟,孙阳阳.基于主成分和粒子群优化支持向量机的管道内腐蚀预测[J].表面技术,2018,47(9):133-140. 被引量：19
6孙彤,褚俊英,刘玉杰.基于PCA和PSO-SVM的轨道电路故障诊断方法研究[J].数码设计,2019,8(19):35-36.

二级引证文献75

1方向,陈思佳,贾颖.基于概率测度支持向量机的静态手写数字识别方法[J].微电子学与计算机,2015,32(4):107-110. 被引量：7
2李杰,孙尧.基于DAMPSO算法的USVs集群攻击任务规划研究[J].计算机工程与应用,2013,49(20):1-4. 被引量：3
3李靖平.基于分块的2DPCA人脸识别方法[J].长春师范学院学报（自然科学版）,2014,33(1):40-44. 被引量：2
4张鹏,谢晓尧.基于改进的C-支持向量机的手写体数字高识别率方法研究[J].贵州师范大学学报（自然科学版）,2014,32(2):95-98. 被引量：4
5李靖平.基于分块的2DPCA人脸识别方法[J].浙江万里学院学报,2014,27(2):93-98.
6高杨,李健.基于EMD-PSO-SVM误差校正模型的国际碳金融市场价格预测[J].中国人口·资源与环境,2014,24(6):163-170. 被引量：42
7蒋超.基于深度学习的物体实时检测模块设计与在安卓系统上的实现[J].科学技术创新,2019(2):76-78.
8张博,康凤举,苏冰.多无人艇联合攻击任务规划模型仿真[J].计算机仿真,2015,32(4):349-354. 被引量：5
9邱文昊,黄考利,金赛赛,连光耀.基于健康度分析与和声蚁群算法-支持向量机的故障预测模型[J].计算机应用,2015,35(11):3252-3255. 被引量：5
10张超,陈利,李琼.一种PST_LDA中文文本相似度计算方法[J].计算机应用研究,2016,33(2):375-377. 被引量：18

1陈圣兵,李龙澍.基于近邻距离的大规模样本集去噪与减样[J].计算机工程,2011,37(5):184-186. 被引量：2
2郑春颖.一种改进的SVM算法[J].航空计算技术,2005,35(2):6-8. 被引量：6
3何慧,胡小红,覃华,张敏.用核K-means聚类减样法优化半定规划支持向量机[J].江西师范大学学报（自然科学版）,2013,37(6):574-578. 被引量：1
4徐燕子,覃华.用核空间距离聚类约简大规模SVM训练集[J].微计算机信息,2010,26(15):197-198. 被引量：1
5覃希,苏一丹.用双层减样法优化大规模SVM垃圾标签检测模型[J].计算机应用研究,2011,28(6):2095-2098. 被引量：5
6姜春良,江汉红,张朝亮,彭艳芳.基于频域滤波的噪声识别去噪算法[J].船海工程,2011,40(2):146-148. 被引量：2
7汪司飞,黄斐.基于K-均值聚类的KPCA在故障诊断中的应用[J].计算机应用与软件,2013,30(4):120-123. 被引量：8
8刘万里,刘三阳,薛贞霞.基于距离核函数的除噪和减样方法[J].系统工程理论与实践,2008,28(7):160-164. 被引量：5
9方科,陈锋,赵子轩,谭现虎.一种基于SVM的最大间隔分类器的研究[J].电子技术（上海）,2008,0(4):77-80.
10张新红,张帆,张军亮.一种改进的二值图像质量评价方法[J].计算机工程与科学,2010,32(6):52-54. 被引量：3

计算机工程与应用

2012年第7期

浏览历史

内容加载中请稍等...

基于样本差异度的SVM训练样本缩减算法被引量：6

参考文献9

二级参考文献31

共引文献67

同被引文献58

引证文献6

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

基于样本差异度的SVM训练样本缩减算法 被引量：6

参考文献9

二级参考文献31

共引文献67

同被引文献58

引证文献6

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

基于样本差异度的SVM训练样本缩减算法被引量：6