一种模糊-证据kNN分类方法被引量：14

A Fuzzy-Evidential k Nearest Neighbor Classification Algorithm

下载PDF

导出

摘要已有的以k-最近邻(kNearest Neighbor,kNN)规则为核心的分类算法,如模糊kNN(FuzzykNN,FkNN)和证据kNN(EvidentialkNN,EkNN)等,存在着两个问题:无法区别出样本特征的差异以及忽略了邻居距训练样本类中心距离的不同所带来的影响.为此,本文提出一种模糊-证据kNN算法.首先,利用特征的模糊熵值确定每个特征的权重,基于加权欧氏距离选取k个邻居;然后,利用邻居的信息熵区别对待邻居并结合FkNN在表示信息和EkNN在融合决策方面的优势,采取先模糊化再融合的方法确定待分类样本的类别.本文的方法在UCI标准数据集上进行了测试,结果表明该方法优于已有算法. The classification algorithms based on k Nearest Neighbor （kNN） rule, such as Fuzzy kNN （FkNN） and Evi- dential kNN （EkNN）, has two problems：the differences of the sample features cannot be recognized and the effect of fuzziness that aroused by the different distances between neighbors and the center of classes is not taken into account. In order to overcome the limitations, the fuzzy-evidential kNN（FEkNN）algorithm is proposed. First, the features＇ weights are determined by the features＇ fuzzy entropy values and k neighbors are selected according to the weighted Euclidean distance. Then samples are classified by the method, which fuzzify memberships of its neighbors first and then fuse the information. And this method combines the advantage of FkNN in information expression with that of EkNN in decision-making. Meanwhile, neighbors are distinguished by their informa- tion entropy values. The presented method is tested on the UCI datasets,and the results show that the proposed method outperforms the other kNN-based classification algorithms.

作者吕锋杜妮文成林

机构地区河北师范大学物理科学与信息工程学院杭州电子科技大学自动化学院

出处《电子学报》 EI CAS CSCD 北大核心 2012年第12期2390-2395,共6页 Acta Electronica Sinica

基金国家自然科学基金(No.60974063 No.61175059)

关键词 k-最近邻(k-NN) 加权欧氏距离模糊熵折扣因子证据理论 k nearest neighbor （k-NN） weighted-Euclidean distance fuzzy entropy discount factor evidence theory

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1Keller J M,Gray M R,Givens J A. A fuzzy k-nearest neighbor algorithm[J].IEEE Transactions on Systems Man and Cybernetics,1985,(04):580-585.
2王熙照.模糊测度和模糊积分及在分类技术中的应用[M]北京:科学出版社,2008207-208.
3Wu Y Q,Ianakiev K,Govindaraju V. Improved k-nearest neighbor classification[J].Pattern Recognition,2002,(10):121-146.
4赵莹,高隽,汪荣贵,胡静.一种新的广义最近邻方法研究[J].电子学报,2004,32(F12):196-198. 被引量：13
5朱明旱,罗大庸,易励群.一种序列的加权kNN分类方法[J].电子学报,2009,37(11):2584-2588. 被引量：15
6刘松华,张军英,许进,贾宏恩.Kernel-kNN:基于信息能度量的核k-最近邻算法[J].自动化学报,2010,36(12):1681-1688. 被引量：16
7Denoeux T. A k-nearest neighbor classification rule based on Dempster-Shafer theory[J].IEEE Transactions on Systems Man and Cybernetics,1995.804-813.
8刘明,袁保宗,唐晓芳.证据理论k-NN规则中确定相似度参数的新方法[J].电子学报,2005,33(4):766-768. 被引量：8
9Anil K G. On optimum choice of k in nearest neighbor classification[J].Computational Statistics and Data Analysis,2006.3113-3123.
10Zouhal L M,Denoeux T. An evidence-theoretic k-NN rule with parameter optimization[J].IEEE Transactions on Systems Man and Cybernetics,1998,(02):263-271.doi:10.1109/5326.669565.

二级参考文献47

1陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：53
2刘明,袁保宗,唐晓芳.证据理论k-NN规则中确定相似度参数的新方法[J].电子学报,2005,33(4):766-768. 被引量：8
3周晓飞,杨静宇,姜文瀚.核最近邻凸包分类算法[J].中国图象图形学报,2007,12(7):1209-1213. 被引量：6
4T M Cover, P E Hart. Nearest neighbor pattern classification [J]. IEEE Trans. on Information Theory, 1967, 13( 1 ):21 - 27.
5Y Yang, X Lin. A re-examination of text categorization methods[ A ]. Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval [C]. New York: ACM, 1999,42 - 49.
6Li Baoli, Chen Yuzhong, Yu Shiwen. A comparative study on automatic categorization methods for Chinese search engine [A]. Proceedings of the Eighth Joint International Computer Conference[ C ]. Hangzhou: Zhejiang University Press, 2002. 117 - 120.
7G Gora, A Wojna. A classifier combining rule induction and k- NN method with automated selection of optimal neighbourhood [ A ]. Proceedings of the Thirteenth European Conference on Machine Learning [C]. Heidelberg: Springer Berlin, 2002, 2430:111 - 123.
8C D' Amato, D Malerba, F Esposito, et al. Extending the k- nearest neighbour classification algorithm to symbolic objects [A]. Atti del Convegno Intermedio della Societa Italiana di Statisfica "Analisi Statisfica Multivariata per le scienze economico-sociali,le scienze naturali e la tecnologia" [C]. Italia: Napoli, 2003.
9W Hechenbichler, K Schliep. Weighted k-nearest-neighbor techniques and, ordinal classification [OL]. http://epub. ub.uni-muenchen.de/1769/, 2007-4-10/2008-9-12.
10D P Vivencio, E R Hruschka, M C Nicoletti, et al. Featureweighted k-nearest neighbor classifier[A]. Proceedings of the IEEE Symposium on Foundations of Computational Intelligence [C], Wsdhington DC, USA: IEEE Communications Society, 2007.481- 486.

共引文献47

1周而重,逄玉俊.一种改进的K近邻法在模式识别中的应用[J].沈阳师范大学学报（自然科学版）,2007,25(4):475-478. 被引量：5
2张蕾,普杰信,范庆辉.基于遗传算法和BP网络的物体识别方法[J].计算机工程与设计,2008,29(7):1785-1788. 被引量：6
3洪占勇,邓善熙.多分辨率非整数倍图象缩放的硬件快速算法[J].电子测量与仪器学报,2008,22(5):78-82. 被引量：2
4胡正平,贾千文.基于SRM自组织多区域覆盖的可拒绝近邻分类算法研究[J].电子与信息学报,2009,31(2):293-296. 被引量：3
5李燕萍,唐振民,钱博,张燕.基于仿生模式识别的说话人辨认方法研究[J].系统仿真学报,2009,21(7):1912-1915. 被引量：1
6杜明,周而重.机器学习在模式识别中的应用研究[J].科技信息,2009(9):37-38. 被引量：6
7朱明旱,罗大庸,易励群.一种序列的加权kNN分类方法[J].电子学报,2009,37(11):2584-2588. 被引量：15
8王丹,张祥合,张立,任露泉.多维多分辨仿生识别方法及其应用[J].吉林大学学报（工学版）,2011,41(2):408-412. 被引量：2
9刘军立,孙劲光.基于高维仿生覆盖的人脸识别方法[J].计算机工程与应用,2011,47(17):178-180. 被引量：1
10程慧杰,张国印,何颖.基于基因表达谱特征分布的SOM聚类算法研究[J].计算机工程与设计,2011,32(7):2463-2466.

同被引文献116

1蒋盛益,谢照青,余雯.基于代价敏感的朴素贝叶斯不平衡数据分类研究[J].计算机研究与发展,2011,48(S1):387-390. 被引量：21
2赵志滨,贾岩峰,姚兰,鲍玉斌.含有丰富结构化数据的Web页面分类技术的研究[J].计算机研究与发展,2013,50(S1):53-60. 被引量：5
3杨益民,冯敏,毛振伟,王昌燧,凌雪,龚明,孙新民,郭木森.汝瓷及其仿制品瓷釉的显微结构分析和“汝钧不分”难题的破解[J].分析测试学报,2005,24(6):16-20. 被引量：7
4张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958. 被引量：84
5曾庆鹏,吴润秀.污水化学耗氧量ROUGH控制分析[J].江西化工,2006,22(1):88-91. 被引量：1
6侯志强,韩崇昭.视觉跟踪技术综述[J].自动化学报,2006,32(4):603-617. 被引量：256
7苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：394
8宋笑雪,解争龙,张文修.集值决策信息系统的知识约简与规则提取[J].计算机科学,2007,34(4):182-184. 被引量：27
9COVER T, HART P. Nearest neighbor pattern classification [J]. IEEE Transactions on Information Theory, 1967 (13) : 21-27.
10WU X D, KUMAR V, QUINLAN J R, et al. Top 10 algo- rithms in data mining [ J ]. Knowledge and Information Sys- tems, 2008,14(1) : 1-37.

引证文献14

1林耀进,李进金,陈锦坤,马周明.融合邻域信息的k-近邻分类[J].智能系统学报,2014,9(2):240-243. 被引量：3
2吕琳,刘培玉.一种基于C4.5决策树算法的Web页面分类算法[J].山东师范大学学报（自然科学版）,2015,30(2):20-23. 被引量：1
3侯晓东,蔡斌斌,金炜东,段旺旺.基于证据距离和模糊熵的加权证据融合新方法[J].广西师范大学学报（自然科学版）,2015,33(1):45-51. 被引量：3
4吴润秀.一种结合DS证据理论的改进KNN分类算法[J].统计与决策,2015,31(15):16-19. 被引量：3
5兰丽辉,鞠时光.基于向量相似的权重社会网络隐私保护[J].电子学报,2015,43(8):1568-1574. 被引量：4
6李卫平,杨杰,王钢.比例逆权重kNN算法及其流处理应用[J].计算机工程与设计,2015,36(12):3355-3358. 被引量：5
7夏瑜,吴小俊,周立凡,李菊.基于多层字典的自重构目标跟踪算法[J].光电子．激光,2018,29(1):77-84. 被引量：1
8刘诚诚,姜瑛.基于紧密度的模糊加权kNN数据分类方法[J].应用科学学报,2018,36(4):679-688. 被引量：6
9胡文斌,邱振宇,聂聪,王欢,严丽平,杜博.数据广播调度自适应信道划分与分配方法[J].软件学报,2018,29(9):2844-2860. 被引量：2
10刘诚诚,姜瑛.一种改进模糊kNN的云计算故障检测方法[J].小型微型计算机系统,2018,39(10):2285-2290. 被引量：6

二级引证文献43

1崔宾阁,庄仲杰.基于最佳距离度量的两层最近邻分类算法[J].山东科技大学学报（自然科学版）,2015,34(3):20-27. 被引量：3
2赵夫群.基于半监督学习的Web页面内容分类技术研究[J].现代电子技术,2016,39(1):108-112. 被引量：1
3王宁奎,魏代俊.基于D数理论的不确定多属性决策方法[J].湖北民族学院学报（自然科学版）,2016,34(1):35-39. 被引量：6
4陈春玲,熊晶,陈琳,余瀚.加权社会网络中的个性化隐私保护算法[J].计算机技术与发展,2016,26(8):88-92. 被引量：1
5齐林海,陈思路,任旭,熊里.能源互联网信息特征及其云平台处理技术[J].电力信息与通信技术,2016,14(9):28-32. 被引量：8
6韩云飞,张太红,白涛.融合Mel系数和kNN的语音端点检测[J].信息技术,2017,41(3):37-41. 被引量：2
7肖程望,卢军,余力耕,张弛.适用于手机取证数据的权重计算方法[J].计算机系统应用,2017,26(9):200-204.
8林航,李葵,林杰华,乐志伟,王浩,周立.面向大中型机房的RSSI定位算法研究[J].合肥工业大学学报（自然科学版）,2017,40(9):1193-1198.
9鲁自立,贾鑫,曾创展.基于特征提取的快速SAR-BM3D相干斑抑制算法[J].电子测量技术,2018,41(1):123-128. 被引量：2
10朱利娟,云中华,边巴旺堆.基于极坐标变换的脱机手写藏文字符特征提取方法[J].计算机应用与软件,2018,35(3):162-166. 被引量：7

1秦娜,金炜东,黄进,李智敏.高速列车转向架故障信号的聚合经验模态分解和模糊熵特征分析[J].控制理论与应用,2014,31(9):1245-1251. 被引量：14
2张子迎,张汝波,刘心.自治水下机器人的局部规划方法[J].计算机工程,2008,34(13):180-181.
3刘准钆,程咏梅,潘泉,苗壮.多传感器冲突信息的加权融合算法[J].传感技术学报,2009,22(3):366-370. 被引量：30
4胡海亮,钟求喜,刘浏.基于迭代合成的D-S证据理论改进方法[J].计算机应用研究,2016,33(10):2985-2987. 被引量：12
5林永民,朱卫东.模糊kNN在文本分类中的应用研究[J].计算机应用与软件,2008,25(9):185-187. 被引量：4
6许将军,杜仲.一种改进的证据权重确定方法[J].火力与指挥控制,2015,40(4):81-83. 被引量：1
7尚文倩,瞿有利,黄厚宽,朱海滨,林永民,董红斌.基于基尼的模糊kNN分类器(英文)[J].广西师范大学学报（自然科学版）,2006,24(4):87-90.
8蒋黎明,何加浪,张宏.D-S证据理论中一种新的冲突证据融合方法[J].计算机科学,2011,38(4):236-238. 被引量：17
9周理,刘琰.基于状态BPA折扣因子的过程状态估计算法[J].信息与控制,2014,43(2):141-145.
10何海江,何文德,刘华富.集成最近邻规则的半监督顺序回归算法[J].计算机应用,2010,30(4):1022-1025. 被引量：1

电子学报

2012年第12期

浏览历史

内容加载中请稍等...

一种模糊-证据kNN分类方法被引量：14

参考文献14

二级参考文献47

共引文献47

同被引文献116

引证文献14

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

一种模糊-证据kNN分类方法 被引量：14

参考文献14

二级参考文献47

共引文献47

同被引文献116

引证文献14

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

一种模糊-证据kNN分类方法被引量：14