偏相关方法在软件缺陷预测中的应用被引量：3

Partial correlation analysis for software defect prediction

下载PDF

导出

摘要为了提高预测模型的性能,解决不同属性子集带来的分歧,提出了基本偏相关方法的预测模型。首先,该方法在公开数据集上分析出代码静态属性与缺陷数之间存在偏相关关系;然后基于偏相关系数值,计算出代码复杂性度密度属性值;最后基于该属性值建立新的缺陷预测模型。实验表明,该模型具有较高的召回率和很好的F-measure性能,从而进一步证实了代码属性与模块缺陷之间的偏相关性是影响软件质量预测性能的重要因素的结论。该结论有助于建立更加稳定可靠的软件缺陷预测模型。 In order to improve the performance of predictors,and reduce the dissention,this paper propsed a new predict model based on partial correlation analysis.Firstly,different to prior works,analyzed the correlation between attributes and defects.Then computed code complexity density values.Based on these values,built a new predictor.Experiments were performed on the public Eclipse dataset.This predictor had a good performance with high recall rates and substantially high F-measure values.The satisfactory results also confirm the partial correlation is a very important factor in software quality analysis.This conclusion is helpful for building more stable defect predictors.

作者马樱罗光春李炯陈爱国

机构地区电子科技大学计算机科学与工程学院

出处《计算机应用研究》 CSCD 北大核心 2012年第2期594-596,613,共4页 Application Research of Computers

基金新世纪优秀人才支持计划资助项目(NCET-10-0298) 四川省科技支撑计划资助项目(2011GZ0192) 中央高校基本科研业务费专项资助项目(ZYGX2009J066)

关键词软件缺陷预测代码静态属性实证复杂度机器学习偏相关 software defect prediction static code attributes empirical complexity machine learning partial correlation

分类号 TP301.5 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献17

1CATAL C. Software fault prediction: a literature review and current trends[ J]. Expert Systems with Applications: An International Journal,2011,38(4) :4626-4636.
2LIU Yi, KHOSHGOFTAAR T M, SELIYA N. Evolutionary optimiza- tion of software quality modeling with multiple repositories[ J]. IEEE Trans on Software Enclineering,2010,36(6) :852-864.
3MENZIES T, MILTON Z, TURHAN B, et al. Defect prediction from static code features : current results, limitations, new approaches [ J ]. Automated Software Engineering ,2010,17 (4) :375-407.
4AUBRAMANYAN R, KRISHNAN M S. Empirical analysis of CK metrics for object-oriented design complexity : implications for software defects[ J ]. IEEE Trans on Software Engineering,2003,29 (4) : 297-310.
5GYIMOTHY T, RERENC R, SIKET I. Empirical validation of ob- ject-oriented metrics on open source software for fault prediction [ J ]. IEEE Trans on Software Engineering ,2005,31 (10) :897-910.
6KHOSHGOFTAAR T M, SELIYA N. The necessity of assuring quali- ty in software measurement data[ C ]// Proc of the 10th International Conference on Software Metrics. 2004 : 119-130.
7MENZIES T, GREENWALD J, FRANK A. Data mining static code attributes to learn defect predictors [ J ]. IEEE Trans on Software Engineering ,2007,32( 11 ) :2-13.
8SHEPPED M, INCE D. A critique of three metrics[ J]. Journal of Systems and Software, 1994,26 ( 3 ) : 197- 210.
9FENTON N, OHLSSON N. Quantitative analysis of faults and failures in a complex software system[J]. IEEE Trans on Software Engi- neering, 2000,26 ( 8 ) :797- 814.
10ANDERSSON C, RUNESON P. A replicated quantitative analysis of fault distributions in complex software systems[ J]. IEEE Trans on Software Engineering,2007,33 ( 5 ) :273- 286.

二级参考文献58

1Blum A, Mitchell T. Combining labeled and unlabeled data with co-training. In Proc. the 11th Annual Conference on Computational Learning Theory, Madison, USA, Jul.24-26,1998,pp.92-100.
2Goldman S, Zhou Y. Enhancing supervised learning with un-labeled data. In Proc. the 17th International Conference onMachine Learning, San Francisco, USA, Jun. 29-Jul.2,2000,pp.327-334.
3Li M, Zhou Z H. Improve computer-aided diagnosis with ma-chine learning techniques using undiagnosed samples. IEEE Transactions on Systems, Man and Cybernetics - Part A: Systems and Humans,2007,37(6):1088-1098.
4Zhou Z H, Li M. Tri-training: Exploiting unlabeled data us-ing three classifiers. IEEE Transactions on Knowledge and Data Engineering,2005,17(11):1529-1541.
5Zhou Z H, Li M. Semi-supervised regression with co-training style algorithms. IEEE Transactions on Knowledge and Data Engineering,2007,19(11):1479-1493.
6Steedman M, Osborne M, Sarkar A et al. Bootstrapping sta-tistical parsers from small data sets. In Proc. the 11th Con-ference on the European Chapter of the Association for Com-putational Linguistics, Budapest, Hungary, Apr.12-17,2003, pp.331-338.
7Li M, Zhou Z H. Semi-supervised document retrieval. Infor-mation Processing & Management,2009,45(3):341-355.
8Zhou Z H, Chen K J, Dai H B. Enhancing relevance feedback in image retrieval using unlabeled data. ACM Transactions on Information Systems,2006,24(2):219-244.
9Chawla N V, Bowyer K W, Hall L O, Kegelmeyer W P SMOTE: Synthetic minority over-sampling technique. Jour-nal ol Artificial Intelliqence Research,2002,16:321-357.
10Kubat M, Matwin S. Addressing the curse of imbalanced training sets: One-sided selection. In Proe. the 14th Int. Conf. Machine Learning, Nashville, USA,1997,pp.179-186.

共引文献179

1李盼池,许少华.支持向量机及其在复杂水淹层识别中的应用[J].计算机应用,2004,24(9):147-149. 被引量：18
2李忠伟,张健沛,张福顺,安辉.基于SVM的虚拟企业伙伴决策系统的设计与实现[J].计算机工程与应用,2004,40(19):198-199. 被引量：2
3张辉,张浩,徐征,陆剑峰.基于支持向量机的供应链伙伴企业选择方法的研究[J].计算机集成制造系统,2004,10(7):796-800. 被引量：10
4沈丽虹,周昌乐.基于语义空间的支持向量机的文本过滤[J].计算机应用,2005,25(3):664-665. 被引量：3
5汪江,陆颂元.汽轮发电机组故障诊断GA-SVM模型方法的研究[J].汽轮机技术,2005,47(1):1-3. 被引量：6
6袁圣江.基于粗糙集和支持向量机的机械故障诊断系统[J].微机发展,2005,15(3):110-112. 被引量：4
7田雪,纪玉波,杨旭.基于支持向量机的自动人脸识别[J].计算机工程,2005,31(5):191-193. 被引量：3
8郑水波,唐厚君,韩正之,张勇.基于支持向量机的ESP系统传感器故障诊断方法[J].系统仿真学报,2005,17(3):682-684. 被引量：5
9郑水波,韩正之,唐厚君,张勇.最小二乘支持向量机在汽车动态系统辨识中的应用[J].上海交通大学学报,2005,39(3):392-395. 被引量：21
10杨一文,杨朝军.基于支持向量机的金融时间序列预测[J].系统工程理论方法应用,2005,14(2):176-181. 被引量：20

同被引文献26

1赵亮,侯金宝.文件和包层次的软件缺陷预测[J].清华大学学报（自然科学版）,2011,51(S1):1472-1476. 被引量：2
2王海燕,杨方廷,刘鲁.标准化系数与偏相关系数的比较与应用[J].数量经济技术经济研究,2006,23(9):150-155. 被引量：102
3王贺.基于ODC的软件缺陷管理方法的研究与应用[J].北京:北京邮电大学,2009.
4聂剑平,韩柯,陈光,曹旭.软件缺陷增长过程的混沌分析[J].计算机工程与应用,2008,44(11):97-100. 被引量：3
5王凌,高歌,张强,孙家民,王遵娅,张勇,赵珊珊,陈鲜艳,陈峪,王有民,陈丽娟,高辉.2008年1月我国大范围低温雨雪冰冻灾害分析Ⅰ.气候特征与影响评估[J].气象,2008,34(4):95-100. 被引量：215
6王青,伍书剑,李明树.软件缺陷预测技术[J].软件学报,2008,19(7):1565-1580. 被引量：149
7刘海,郝克刚.软件缺陷数据的分析方法及其实现[J].计算机科学,2008,35(8):262-264. 被引量：10
8邹旭恺,张强.近半个世纪我国干旱变化的初步研究[J].应用气象学报,2008,19(6):679-687. 被引量：166
9李心科,金元杰.基于灰色预测理论的软件缺陷预测模型研究[J].计算机应用与软件,2009,26(3):101-103. 被引量：12
10卢丽萍,程丛兰,刘伟东,覃志豪.30年来我国农业气象灾害对农业生产的影响及其空间分布特征[J].生态环境学报,2009,18(4):1573-1578. 被引量：110

引证文献3

1常瑞花,贾鹏.基于度量元的静态软件缺陷预测技术[J].火力与指挥控制,2015,40(2):1-5. 被引量：2
2于小兵,卢逸群,吉中会,骆翔,蔡玫.近45 a来我国农业气象灾害变化特征及其对粮食产量的影响[J].长江流域资源与环境,2017,26(10):1700-1710. 被引量：27
3李顺勇,高艳.一种基于三次曲线关系变量间的偏相关分析[J].云南民族大学学报（自然科学版）,2018,27(2):113-118. 被引量：3

二级引证文献32

1周喜平,何保锋.静态软件中故障数据预测建模研究仿真[J].计算机仿真,2016,33(5):443-446. 被引量：3
2郝学良,朱小冬,叶飞.基于配置管理的软件维护性评估[J].火力与指挥控制,2016,41(10):142-145.
3熊德斌,张萌.长江经济带粮食产量的时空特征及影响因素分析——基于1990-2015年11个省市面板数据的实证研究[J].新疆农垦经济,2018(11):19-26. 被引量：1
4付广水.我国互联网+水产养殖现状分析[J].数码设计,2017,6(15):19-19.
5暴向平,庞燕,贾福平.乌兰察布市旅游产业与新型城镇化耦合协调度及其影响因素分析[J].西北师范大学学报（自然科学版）,2020,56(2):117-124. 被引量：8
6杨斌斌,张丽丽,任玉欢,尹文耀,代淑媚.临汾市主要气象灾害变化特征分析[J].农业灾害研究,2020,10(2):87-90. 被引量：1
7易弘睿.深圳居民健康水平评估与测控模型研究[J].科技资讯,2020,18(12):180-182.
8王祥,淮建军.基于三级分层框架的农业气象灾害多风险评估[J].自然资源学报,2020,35(6):1460-1471. 被引量：16
9孔冬艳,陈会广.近40年来中国农作物与耕地受灾时空特征及影响因素分析[J].长江流域资源与环境,2020,29(5):1236-1246. 被引量：11
10刘玉汐,任景全,孙月,马云飞,袭祝香,郭春明,陈长胜.1971—2016年东北地区农业气象灾害损失变化特征及影响[J].干旱气象,2020,38(4):647-654. 被引量：25

1董西伟,王玉伟,张广顺,周才学.基于迁移学习的跨公司软件缺陷预测[J].计算机工程与设计,2016,37(3):684-689. 被引量：1
2郝志峰,吕宏伟,蔡瑞初,袁畅.基于条件独立性的LiNGAM模型剪枝算法[J].计算机应用与软件,2016,33(8):249-253. 被引量：1
3李支元.基于大数据的订餐系统中偏相关分析技术的应用研究[J].软件工程师,2015(12):18-19.
4夏蓉.基于ARMA模型的我国工业总产值的时间序列分析[J].软件导刊,2008,7(6):143-144. 被引量：6
5陈庭木,徐大勇,秦德荣,方兆伟,樊继伟,钟环,卢百关.偏相关与通径分析的EXCEL VBA程序设计[J].农业网络信息,2007(3):101-103. 被引量：12
6徐金东,倪梦莹,杨尚国,吴冬梅.一种基于数字水印的图像检索方案[J].计算机工程,2009,35(13):147-149. 被引量：1
7武阿璟.互联网发展和技术创新能力的偏相关分析[J].机械制造,2011,49(3):71-74. 被引量：3
8林开标,马樱,胡建强,朱顺痣.静态代码属性与软件模块缺陷数的偏相关分析[J].厦门理工学院学报,2014,22(5):62-66. 被引量：1
9王凯,谢岳通.无线网络满意度的数理统计建模分析[J].通信技术,2014,47(10):1191-1197. 被引量：1
10陈雨,韩永明,王尊,耿志强.基于数据复杂网络理论的系统故障检测方法[J].化工学报,2014,65(11):4503-4508. 被引量：8

计算机应用研究

2012年第2期

浏览历史

内容加载中请稍等...

偏相关方法在软件缺陷预测中的应用被引量：3

参考文献17

二级参考文献58

共引文献179

同被引文献26

引证文献3

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

偏相关方法在软件缺陷预测中的应用 被引量：3

参考文献17

二级参考文献58

共引文献179

同被引文献26

引证文献3

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

偏相关方法在软件缺陷预测中的应用被引量：3