将KFCM算法应用于源代码挖掘的研究被引量：3

Research on applying KFCM algorithm to source code mining

下载PDF

导出

摘要为解决软件工程数据量大、属性多且多为离散型数据的特点,提高软件工程数据的挖掘效率,寻求更快速、高效的聚类算法,提出了将基于核函数的模糊聚类算法应用于源代码挖掘;同时采用TF-IDF方法对离散型文本数据进行处理,解决了核模糊聚类算法不能对文本数据直接进行聚类的问题。将遗传算法与KFCM算法相结合,克服了KFCM只能求解局部极小值的问题。实验结果表明,改进的KFCM算法对软件工程数据的挖掘有很好的聚类效果,且有较高的效率。 It provides that Kernelized fuzzy C-means uses on the research of source code mining for solving the significant number of quantities,multiple attributes and most of the attributes are discrete data and improving the efficiency of mining software engineering data,also seeking faster and more effective cluster approaches;meanwhile,to solve the problem that the KFCM algorithm can not cluster text data directly,the TF-IDF method is used to process the discrete text data.Then we integrate KFCM and genetic algorithm to overcome the defect of only being able to obtain the local minimum value by KFCM.Finally,the experimental results illustrate the improved KFCM algorithm can achieve good clustering performance and high efficiency for software engineering data mining.

作者孟美芝张阳

机构地区西北农林科技大学信息工程学院

出处《计算机工程与设计》 CSCD 北大核心 2010年第10期2249-2252,共4页 Computer Engineering and Design

关键词源代码挖掘特征空间核函数遗传算法目标函数 source code mining feature space kernel function genetic algorithm object function

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献15

1Han JW, Kambr M.Data mining concepts and techniques[M]. Beijing:Higher Education Press,2001:145-176.
2苏绍勇,潘金贵.数据挖掘在软件维护中的应用[J].计算机科学,2005,32(10):245-248. 被引量：3
3David Binkley.Source code analysis:A road map[C].Future of Software Engineering,2007:104-119.
4钟智,尹云飞,张师超.软件系统层次的数据挖掘方法[J].计算机科学,2005,32(2):202-205. 被引量：2
5Antonellis P, Antoniou D,Kanellopoulos Y, et al.A data mining methodology for evaluating maintainability according to ISO/ IEC-9126 software engineering-product quality standard [C]. Special Session on System Quality and Maintainability,Organized in Conjunction with the 11th European Conference on Software Maintenance and Reengineering,2007.
6Yiannis Kanellopoulos, Christos Tjortjis. Data mining source code to facilitate program comprehension:Experiments on clustering data retrieved from C++ programs[C].Proc IEEE 12th Int'l Workshop Program Comprehension, IEEE Comp Soc Press, 2004:214-223.
7Dimitris Rousidis, Christos Tjortjis. Clustering data retrieved from Java source code to support software maintenance:A case study[C].Proc IEEE 9th European Conf Software Maintenance and Reengineering,2005:276-279.
8Yiannis Kanellopoulos, Thimios Dimopulos. Mining source code elements for comprehending object-oriented systems and evaluating their maintainability[J].SIGKDD Explorations,2006,8(1):33-40.
9Girolami M.Mercer kernel based clustering in feature space[J]. IEEE Transactions on Neural Network,2002,13 (3):780-784.
10张莉,周伟达,焦李成.核聚类算法[J].计算机学报,2002,25(6):587-590. 被引量：197

二级参考文献47

1伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
2王秀娟,郭军,郑康锋.文本分类中一种新的特征选择方法[J].计算机应用,2005,25(3):661-663. 被引量：15
3李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：117
4柴玉梅,王宇.基于TFIDF的文本特征选择方法[J].微计算机信息,2006,22(08X):24-26. 被引量：32
5张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：121
6张海龙,王莲芝.自动文本分类特征选择方法研究[J].计算机工程与设计,2006,27(20):3840-3841. 被引量：45
7Paulk M C. Capability Maturity Model Version1. 1 [J]. IEEE Software,10 4,July 1993.?A
8Boehm B. Software Engineering Economics[J]. Englewood Cliffs,NJ, Prentice-Hall, 1981.
9Zhang C Q,Zhang S C. Association Rule Mining Models and Algorithms[M]. Springer-Verlag,Berlin Heidelberg,2002.
10Zhang S C,Zhang C Q. Discovering Causality in Large Databases [J]. Applied Artificial Intelligence, 2002.

共引文献236

1吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
2梁久祯.核函数参数优化的聚类算法[J].仪器仪表学报,2005,26(z1):678-680. 被引量：2
3吕艳坤.软件维护中的应用技术研究[J].科技资讯,2008,6(5). 被引量：1
4宋启祥,张明玉,张锏.基于核聚类的MRI和PET医学图像分割方法[J].宿州学院学报,2005,20(1):88-90. 被引量：1
5沈红斌,王士同,吴小俊.离群模糊核聚类算法[J].软件学报,2004,15(7):1021-1029. 被引量：37
6伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
7陈才扣,高林,高秀梅,杨静宇.基于聚类的核矩阵维度缩减[J].数据采集与处理,2004,19(3):250-253.
8赵姝,张燕平,张媛,陈传明.基于交叉覆盖算法的改进算法——核平移覆盖算法[J].微机发展,2004,14(11):1-3. 被引量：6
9郑岩,黄荣怀,战晓苏,周春光.基于遗传算法的动态模糊聚类[J].北京邮电大学学报,2005,28(1):75-78. 被引量：22
10潘晓英,王昊.一种基于核聚类的关键帧提取方法[J].微机发展,2005,15(3):29-31. 被引量：8

同被引文献16

1王超,姜威.基于K近邻加权的混合C均值聚类算法[J].计算机工程与应用,2006,42(30):84-87. 被引量：2
2Shao Bin, Xin Hongwei. A real-time computer vision assessment and control of thermal comfort for group-housed pigs [ J ]. Computer and E- lectronics in Agriculture, 2008,62( 1 ) :15 -21.
3Wang ZQ. Geo-statistics and Its Application in Ecology[ M ]. Beijing: Science Press, 1999.
4Wu Y, et al. Brain MRI segmentation using KFCM and Chan-Vese model[ M ]. Transactions of Tianjin University, Springer, 2011,17 : 215 -219.
5曲福恒,崔广才,李岩芳,等.模糊聚类算法及其应用[M].北京:国防工业出版社.2011:68-71.
6Hidetomo Ichihashi, Katsuhiro Honda. FCM Clustering from the View Point of Iteratively Reweighted Least Squares[ C]. IEEE International Conference on Fuzzy Systems, 2005:873 -878.
7Tara Saikumar, Anoop BK, Murthy PS. Robust Adaptive Threshold Algorithm based on Kernel Fuzzy Clustering on Image segmentation [J]. Computer Science & Information Technology (CS & IT) ,2012: 99 - 103.
8Ortega R A, Santibanez 0 A. Determination of management zones in corn based on soil fertility [ J ]. Computers and Electronics in Agricul- ture,2007 (58) :48-59.
9毛澄映,卢炎生,胡小华.数据挖掘技术在软件工程中的应用综述[J].计算机科学,2009,36(5):1-6. 被引量：21
10陶新民,徐晶,付强,刘兴丽.基于样本密度KFCM新算法及其在故障诊断的应用[J].振动与冲击,2009,28(8):61-64. 被引量：14

引证文献3

1王越,黄靖华,张凯文.一种核模糊聚类的改进及其在育肥猪出栏中的应用[J].计算机应用与软件,2013,30(1):120-125. 被引量：2
2罗韬,罗峰.数据挖掘在软件工程领域中的应用浅析[J].电子技术与软件工程,2014(1):222-222. 被引量：5
3张志荣,黄杰,孙伟宏,韩晓东,苏先名.数据挖掘在软件工程领域中的应用浅析[J].电子测试,2013,24(5S):246-247. 被引量：14

二级引证文献21

1王章宁.浅析软件工程的现状及发展趋势[J].软件,2013,34(10):136-137. 被引量：5
2罗韬,罗峰.数据挖掘在软件工程领域中的应用浅析[J].电子技术与软件工程,2014(1):222-222. 被引量：5
3黄世云.软件工程数据挖掘研究进展概述[J].电子技术与软件工程,2014(21):89-89. 被引量：5
4李丛,王云,胡文军,丁勇.基于非欧式距离的模糊核聚类算法在入侵检测的应用[J].计算机与数字工程,2014,42(12):2235-2238. 被引量：1
5刘静,于琬梅,孙卫红,孟晓亮.数据挖掘技术在智能循证医学支持系统中的应用[J].电子技术与软件工程,2015(3):212-212. 被引量：1
6张灿.数据挖掘技术在软件工程中的应用综述[J].信息通信,2014,27(11):141-141. 被引量：2
7孙云鹏.数据挖掘技术在软件工程中的应用综述[J].中国新通信,2015,17(15):128-128. 被引量：5
8吴琼.试析软件工程的数据挖掘技术[J].中国科技博览,2015,0(44):246-246.
9许文杰.数据挖掘技术在软件工程中的应用研究[J].电子技术与软件工程,2015(22):192-192. 被引量：4
10王晓妍.数据挖掘技术在软件工程中的应用探微[J].建材发展导向,2015,13(23):326-327. 被引量：3

1唐寅,闵凉宇.连续值属性约简算法改进[J].时代金融,2016(24).
2吴涤单.基于改进粒子群的K-means聚类算法[J].电脑知识与技术,2014,10(2X):1238-1241. 被引量：4
3王书文,皮炳坤,张弘强,马聪.一种基于模糊核聚类算法的图像分类方法[J].西北师范大学学报（自然科学版）,2016,52(5):42-45. 被引量：1
4赵小强,刘悦婷.一种基于改进混合蛙跳的KFCM算法[J].计算机工程与应用,2013,49(4):141-145. 被引量：2
5裴振奎,胡萍萍.基于PSO_KFCM的医学图像分割[J].计算机工程与设计,2008,29(9):2295-2296. 被引量：4
6王占江,盛春冬,孙惠杰.基于KFCM与SAPSO算法的图像分割[J].辽宁工程技术大学学报（自然科学版）,2010,29(5):1002-1005. 被引量：4
7郑超,徐恬.一种改进的核模糊聚类算法[J].软件导刊,2016,15(1):40-42. 被引量：2
8蒙建军,靳艳红.基于KFCM算法对MRI图像分割的研究[J].湖北民族学院学报（自然科学版）,2011,29(1):108-111.
9赵小强,张守明.基于Boltzmann选择的人工蜂群KFCM算法[J].兰州理工大学学报,2011,37(1):71-75. 被引量：3
10刘汉强,郑朋.局部搜索自适应核模糊聚类方法[J].计算机工程与科学,2016,38(8):1735-1740. 被引量：2

计算机工程与设计

2010年第10期

浏览历史

内容加载中请稍等...

将KFCM算法应用于源代码挖掘的研究被引量：3

参考文献15

二级参考文献47

共引文献236

同被引文献16

引证文献3

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

将KFCM算法应用于源代码挖掘的研究 被引量：3

参考文献15

二级参考文献47

共引文献236

同被引文献16

引证文献3

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

将KFCM算法应用于源代码挖掘的研究被引量：3