融合特征选择与多模型软投票集成学习的代码异味检测方法被引量：2

Code Smell Detection Method Combining Feature Selection and Multi-model Soft-voting Ensemble Learning

下载PDF

导出

摘要代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%. Code smells can lead to the gradual deterioration of software quality and reduce the understandability and maintainability.To detect code smells in software structure,it is proposed a method based on CK metrics and two-step feature selection soft voting ensemble learning in this paper.Firstly,Pearson correlation coefficient was used to remove redundant attributes,and XGBoost feature importance was used to select the attributes with high correlation in the remaining attributes.Then,in order to solve the problem of poor generalization performance using only one single machine learning model,a soft voting ensemble learning model based on five mature machine learning models was proposed to complete the code smells classification detection task.The experiment is based on CK metrics,the data set containing 7 open source projects and 4 types of code odor is used.The results show that the proposed method can reduce the characteristic dimension and is superior to other classification models in terms of performance index,in which F1 value and AUC value increase by 3.24%and 2.32%respectively.

作者黄晨峻高建华 HUANG Chenjun;GAO Jianhua(Department of Computer Science and Technology,Shanghai Normal University,Shanghai 200234,China)

机构地区上海师范大学计算机科学与技术系

出处《小型微型计算机系统》北大核心 2025年第2期504-512,共9页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61672355)资助。

关键词代码异味特征选择 CK度量投票模型集成学习 code smell feature selection CK metrics voting model ensemble learning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1殷瑞笛,吴海涛,高建华,黄子杰.融合测试异味的即时缺陷预测模型探究[J].小型微型计算机系统,2022,43(4):872-881. 被引量：1

同被引文献5

1卜依凡,刘辉,李光杰.一种基于深度学习的上帝类检测方法[J].软件学报,2019,30(5):1359-1374. 被引量：15
2边奕心,王露颖,赵松,朱晓.Android应用程序中代码异味共存现象的实证研究[J].计算机应用研究,2022,39(9):2763-2767. 被引量：3
3田迎晨,李柯君,王太明,焦青青,李光杰,张宇霞,刘辉.代码坏味研究综述[J].软件学报,2023,34(1):150-170. 被引量：6
4吴海涛,蔡咏琦,高建华.Bagging异构集成的代码异味检测与重构优先级划分[J].计算机工程与应用,2024,60(3):138-147. 被引量：1
5边奕心,李禹齐,张子恒,赵松,尹启天,李文渊.深度学习策略下缓慢循环异味检测方法[J].小型微型计算机系统,2024,45(2):490-497. 被引量：3

引证文献2

1王祯启,边奕心,马偌楠,毕博宇,王金鑫.融合静态程序分析与集成学习的Android代码异味共存检测[J].计算机应用研究,2025,42(4):1167-1176.
2张苗,黄子杰,陈军华,高建华.同构集成深度学习的代码异味检测[J].计算机系统应用,2025,34(10):133-142.

1黄康康,高旭,陈开东,梁之琦,叶海森,刘继胜.空调室内人体热舒适控制研究综述与展望[J].家电科技,2024(S01):474-478. 被引量：4
2梅子欣.基于大数据的风力发电机整机组智能控制系统[J].信息记录材料,2025,26(1):160-162.
3崔亦博,孟军,陈宁宁,廖志斌,王芃.CBTC系统与CTCS-2系统贯通运行的ATO技术方案[J].中国铁路,2025(1):76-84. 被引量：3

小型微型计算机系统

2025年第2期

浏览历史

内容加载中请稍等...

融合特征选择与多模型软投票集成学习的代码异味检测方法被引量：2

参考文献1

同被引文献5

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合特征选择与多模型软投票集成学习的代码异味检测方法 被引量：2

参考文献1

同被引文献5

引证文献2

相关作者

相关机构

相关主题

浏览历史

融合特征选择与多模型软投票集成学习的代码异味检测方法被引量：2