期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
High-Impact Bug Report Identification with Imbalanced Learning Strategies 被引量:6
1
作者 Xin-Li Yang David Lo +2 位作者 Xin Xia Qiao Huang Jian-Ling Sun 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期181-198,共18页
In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they oft... In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they often concentrate on bugs that are highly impactful. In the literature, high-impact bugs are used to refer to the bugs which appear at unexpected time or locations and bring more unexpected effects (i.e., surprise bugs), or break pre-existing functionalities and destroy the user experience (i.e., breakage bugs). Unfortunately, identifying high-impact bugs from thousands of bug reports in a bug tracking system is not an easy feat. Thus, an automated technique that can identify high-impact bug reports can help developers to be aware of them early, rectify them quickly, and minimize the damages they cause. Considering that only a small proportion of bugs are high-impact bugs, the identification of high-impact bug reports is a difficult task. In this paper, we propose an approach to identify high-impact bug reports by leveraging imbalanced learning strategies. We investigate the effectiveness of various variants, each of which combines one particular imbalanced learning strategy and one particular classification algorithm. In particular, we choose four widely used strategies for dealing with imbalanced data and four state-of-the-art text classification algorithms to conduct experiments on four datasets from four different open source projects. We mainly perform an analytical study on two types of high-impact bugs, i.e., surprise bugs and breakage bugs. The results show that different variants have different performances, and the best performing variants SMOTE (synthetic minority over-sampling technique) + KNN (K-nearest neighbours) for surprise bug identification and RUS (random under-sampling) + NB (naive Bayes) for breakage bug identification outperform the Fl-scores of the two state-of-the-art approaches by Thung et al. and Garcia and Shihab. 展开更多
关键词 high-impact bug imbalanced learning bug report identification
原文传递
Automated Time Based Multi-Criteria Bug Triage Approach:Developer Working Efficiency and Social Network Based Developer Recommendation
2
作者 YADAV Asmita SINGH Kumar Sandeep 《Journal of Shanghai Jiaotong university(Science)》 EI 2024年第3期566-578,共13页
In software development projects,bugs are common phenomena.Developers report bugs in open source repositories.There is a need to develop high quality developer prediction model that considers developer work satisfacti... In software development projects,bugs are common phenomena.Developers report bugs in open source repositories.There is a need to develop high quality developer prediction model that considers developer work satisfaction,keep within limited development cost,and improve bug resolution time.To address and resolve bug report as soon as possible is the main focus of triager when a new bug is reported.Thus,developer work efficiency is an important factor in bug-fixing.To address these issues,a proposed approach recommends a set of developers that could potentially share their knowledge with each other to fix new bug reports.The proposed approach is called developer working efficiency and social network based developer recommendation(DweSn).It is a composite model that builds developers'profile by using developer average bug fixing time,work efficiency to fix variety of bugs,as well as the developer's social interactions with other developers.A similarity measure is applied between new bug and bugs in corpus to extract the list of capable developers from the corpus.The proposed approach only selects those developers who are active and less loaded with work.The developer with the highest profile score is assigned the bugs.We evaluated our approach on the subset of five large open-source projects including Mozilla,Netbeans,Eclipse,Firefox and OpenOffice,and compared it with the state-of-the-art.The results demonstrate that combination of developers'efficiency with their average bug fixing time and interactions in their social network gives good accuracy and efficiently reduces bug tossing length.This approach shows an improvement in prediction accuracy,precision,recall,F-score and reduced bug tossing length up to 93.89%,93.12%,93.46%,93.27%and 93.25%,respectively.The proposed approach achieved a 93%hit ratio and 93.34%mean reciprocal rank,indicating that our proposed triager is able to efficiently assign bugs to correct developers. 展开更多
关键词 open-source repository bug report bug assignment tossing length bug triager developer social network developer recommendation
原文传递
双视角数据下移动应用BUG报告识别方法研究
3
作者 彭春雨 郑尚 +2 位作者 邹海涛 于化龙 高尚 《江苏科技大学学报(自然科学版)》 CAS 2024年第1期68-74,88,共8页
为了快速而准确地识别其中的BUG报告将有助于开发人员对移动应用进行修复,通过调查移动应用运行的不同阶段,以用户反馈和问题报告两个视角为切入点,提出基于深度学习的移动应用BUG报告自动识别方法,即首先使用Word2Vec获取词向量,其次,... 为了快速而准确地识别其中的BUG报告将有助于开发人员对移动应用进行修复,通过调查移动应用运行的不同阶段,以用户反馈和问题报告两个视角为切入点,提出基于深度学习的移动应用BUG报告自动识别方法,即首先使用Word2Vec获取词向量,其次,构建Bi-LSTM网络获取高级文本特征,并通过注意力机制分配权重以捕获句子中对BUG报告识别起到关键作用的信息,最后获取问题报告的BUG标签.实验结果表明所提方法在准确率、召回率、F1-score和查准率上均有提高,有助于开发人员准确识别移动应用的BUG报告,提高BUG修复效率. 展开更多
关键词 移动应用 软件维护 问题报告 用户反馈 bug标签
在线阅读 下载PDF
基于知识图谱的bug问题探索性搜索方法 被引量:8
4
作者 孙小兵 王璐 +2 位作者 王经纬 李斌 李宇 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1578-1583,共6页
软件bug问题在软件开发与维护过程中不可避免.然而软件历史库中的bug库与commit库之间没有直接的对应关系,并且随着bug信息、commit提交信息量的增长,搜索bug变得更加繁琐.本文提出一种基于知识图谱对bug问题进行探索性搜索的方法.通过... 软件bug问题在软件开发与维护过程中不可避免.然而软件历史库中的bug库与commit库之间没有直接的对应关系,并且随着bug信息、commit提交信息量的增长,搜索bug变得更加繁琐.本文提出一种基于知识图谱对bug问题进行探索性搜索的方法.通过建立bug报告、commit提交信息及相关人员(如:bug报告人、commit提交者等)信息的bug知识图谱,并结合探索性搜索的思想,不仅能准确搜索bug问题,还能提供相关辅助信息对bug问题进行探索性搜索,帮助软件开发人员更有效地理解和解决bug问题. 展开更多
关键词 bug报告 commit提交 知识图谱 探索性搜索
在线阅读 下载PDF
Bug localization based on syntactical and semantic information of source code
5
作者 YAN Xuefeng CHENG Shasha GUO Liqin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第1期236-246,共11页
The existing software bug localization models treat the source file as natural language, which leads to the loss of syntactical and structure information of the source file. A bug localization model based on syntactic... The existing software bug localization models treat the source file as natural language, which leads to the loss of syntactical and structure information of the source file. A bug localization model based on syntactical and semantic information of source code is proposed. Firstly, abstract syntax tree(AST) is divided based on node category to obtain statement sequence. The statement tree is encoded into vectors to capture lexical and syntactical knowledge at the statement level.Secondly, the source code is transformed into vector representation by the sequence naturalness of the statement. Therefore,the problem of gradient vanishing and explosion caused by a large AST size is obviated when using AST to the represent source code. Finally, the correlation between bug reports and source files are comprehensively analyzed from three aspects of syntax, semantics and text to locate the buggy code. Experiments show that compared with other standard models, the proposed model improves the performance of bug localization, and it has good advantages in mean reciprocal rank(MRR), mean average precision(MAP) and Top N Rank. 展开更多
关键词 bug report abstract syntax tree code representation software bug localization
在线阅读 下载PDF
Bug Prioritization Using Average One Dependence Estimator
6
作者 Kashif Saleem Rashid Naseem +3 位作者 Khalil Khan Siraj Muhammad Ikram Syed Jaehyuk Choi 《Intelligent Automation & Soft Computing》 SCIE 2023年第6期3517-3533,共17页
Automation software need to be continuously updated by addressing software bugs contained in their repositories.However,bugs have different levels of importance;hence,it is essential to prioritize bug reports based on... Automation software need to be continuously updated by addressing software bugs contained in their repositories.However,bugs have different levels of importance;hence,it is essential to prioritize bug reports based on their sever-ity and importance.Manually managing the deluge of incoming bug reports faces time and resource constraints from the development team and delays the resolu-tion of critical bugs.Therefore,bug report prioritization is vital.This study pro-poses a new model for bug prioritization based on average one dependence estimator;it prioritizes bug reports based on severity,which is determined by the number of attributes.The more the number of attributes,the more the severity.The proposed model is evaluated using precision,recall,F1-Score,accuracy,G-Measure,and Matthew’s correlation coefficient.Results of the proposed model are compared with those of the support vector machine(SVM)and Naive Bayes(NB)models.Eclipse and Mozilla datasetswere used as the sources of bug reports.The proposed model improved the bug repository management and out-performed the SVM and NB models.Additionally,the proposed model used a weaker attribute independence supposition than the former models,thereby improving prediction accuracy with minimal computational cost. 展开更多
关键词 bug report triaging PRIORITIZATION support vector machine Naive Bayes
在线阅读 下载PDF
汽车12V蓄电池亏电原因及应对措施研究
7
作者 田丽娟 《汽车电器》 2025年第3期63-66,共4页
文章针对汽车12V蓄电池亏电的问题,解析造成亏电的主要原因,包括充电不足、过度使用车辆和车辆异常工作。针对每一种主要原因提出对应的解决方案,包括优化系统控制策略、提高电池充电接受能力、手机APP主动提示、智能熔断丝盒主动断电、... 文章针对汽车12V蓄电池亏电的问题,解析造成亏电的主要原因,包括充电不足、过度使用车辆和车辆异常工作。针对每一种主要原因提出对应的解决方案,包括优化系统控制策略、提高电池充电接受能力、手机APP主动提示、智能熔断丝盒主动断电、ECU主动复位及故障数据上报等技术。 展开更多
关键词 汽车蓄电池 亏电 主动断电 主动复位 故障上报
在线阅读 下载PDF
强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法
8
作者 谢琪 刘彦辰 《西南民族大学学报(自然科学版)》 2025年第3期298-307,共10页
自动重复软件缺陷检测是缺陷处理流程中的关键环节,其性能直接影响缺陷解决的整体效率.针对现阶段研究中预训练模型的长度限制问题和特征单一问题,提出一种强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法.该方法通过结合BiLST... 自动重复软件缺陷检测是缺陷处理流程中的关键环节,其性能直接影响缺陷解决的整体效率.针对现阶段研究中预训练模型的长度限制问题和特征单一问题,提出一种强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法.该方法通过结合BiLSTM-Attention机制与Longformer预训练模型,增强对篇章级文本的长程语义信息捕捉能力,从而提取更准确的语义相似度特征.其次,针对结构化元数据类别信息,构建特征提取网络以抽取类别相似度特征.最终,将上述特征与词组重叠特征融合后训练分类模型,以实现高效的重复缺陷报告检测.通过在Bugzilla、JIRA和GitHub平台的Eclipse、NetBeans、OpenOffice、Hadoop和VSCode项目上进行实验,结果表明,与基线方法相比,所提方法在F1分数和Accuracy上分别平均提升了2.40%和2.12%,在跨平台场景下实现了更优的检测性能. 展开更多
关键词 重复软件缺陷报告检测 Longformer 语义相似度 长程依赖
在线阅读 下载PDF
浅析BUG管理
9
作者 李晓叶 《计算机光盘软件与应用》 2011年第19期108-108,共1页
在软件测试的过程中,BUG管理是一个很重要的环节,它是测试人员和开发人员之间的桥梁,对BUG进行有效的管理,能够提高项目团队的工作质量和效率。
关键词 软件测试 bug bug报告 bug管理
在线阅读 下载PDF
DBugHelper:分布式系统Debug协助工具
10
作者 张燕飞 张春熙 +1 位作者 李宇明 张蓉 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期153-164,共12页
对于大规模分布式系统的开发而言,其开发周期比较漫长,包括前期的开发、过程中的Debug、后期的维护和测试等.在整个开发周期中,Debug是一个非常关键和重要的环节,如何才能在短时间内找到最可靠的方法来解除bug成为一个重要的挑战.对于... 对于大规模分布式系统的开发而言,其开发周期比较漫长,包括前期的开发、过程中的Debug、后期的维护和测试等.在整个开发周期中,Debug是一个非常关键和重要的环节,如何才能在短时间内找到最可靠的方法来解除bug成为一个重要的挑战.对于系统开发人员来说,bug报告能非常有效地帮助其了解bug的所有特征信息,并找到能修复bug的方法.通过研究发现,许多大规模分布式系统之间具有较强的相关性和相似性,因而其bug的产生情况和修复方法也具有类似特征.开发人员可以利用已存在的修复bug的方案来协助修复与其一致或相近的bug.本文提出一个适用于大规模分布式系统的Debug协助工具——DBugHelper,能为某些大规模分布式系统的开发人员的bug修复提供比较有效、正确的帮助.DBugHelper将最新的bug报告进行文本处理,形成查询向量,并将大量已被修复的bug及其相关信息进行离线处理和缓存,从而为在线查询提供索引机制.通过将大量已修复的bug报告进行离线处理并同时减少在线处理的数据量,从而使其准确并快速地为系统开发人员提供必要的Debug协助工作,以此减少系统开发的周期与成本. 展开更多
关键词 大规模分布式系统 DEbug bug报告 协助
在线阅读 下载PDF
基于知识图谱的跨项目安全缺陷报告预测方法 被引量:2
11
作者 郑炜 刘程远 +4 位作者 吴潇雪 陈翔 成婧源 孙小兵 孙瑞阳 《软件学报》 EI CSCD 北大核心 2024年第3期1257-1279,共23页
安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属... 安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属于新启动的项目,没有足够的已标记安全缺陷报告供在实践中构建此软件安全漏洞预测模型.一种简单的解决方案就是使用迁移模型,即利用其他项目已经标记过的数据来构建预测模型.受到该领域最近的两项研究工作的启发,以安全关键字过滤为思路提出一种融合知识图谱的跨项目安全缺陷报告预测方法KG-SBRP(knowledge graph of security bug report prediction).使用安全缺陷报告中的文本信息域结合CWE(common weakness enumeration)与CVE Details(common vulnerabilities and exposures)共同构建三元组规则实体,以三元组规则实体构建安全漏洞知识图谱,在图谱中结合实体及其关系识别安全缺陷报告.将数据分为训练集和测试集进行模型拟合和性能评估.所构建的模型在7个不同规模的安全缺陷报告数据集上展开实证研究,研究结果表明,所提方法与当前主流方法FARSEC和Keyword matrix相比,在跨项目安全缺陷报告预测场景下,性能指标F1-score值可以平均提高11%,除此之外,在项目内安全缺陷报告预测场景下,F1-score值同样可以平均提高30%. 展开更多
关键词 软件安全 安全缺陷报告预测 跨项目 知识图谱 领域知识
在线阅读 下载PDF
融合信息检索和深度模型特征的软件缺陷定位方法 被引量:4
12
作者 申宗汶 牛菲菲 +4 位作者 李传艺 陈翔 李奇 葛季栋 骆斌 《软件学报》 EI CSCD 北大核心 2024年第7期3245-3264,共20页
构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利... 构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利用深度模型特征的缺陷定位方法也取得了一定效果.然而,由于深度模型训练的时间成本和耗费资源相对较高,现有基于深度模型的缺陷定位研究方法存在实验搜索空间和真实情况不符的情况.这些研究方法在测试时并没有将项目下的所有代码作为搜索空间,而仅仅搜索了与已有缺陷相关的代码,例如DNNLOC方法、DeepLocator方法、DreamLoc方法.这种做法和现实中程序员进行缺陷定位的搜索场景是不一致的.致力于模拟缺陷定位的真实场景,提出了一种融合信息检索和深度模型特征的TosLoc方法进行缺陷定位.TosLoc方法首先通过信息检索的方式检索真实项目的所有源代码,确保已有特征的充分利用;再利用深度模型挖掘源代码和缺陷报告的语义,获取最终定位结果.通过两阶段的检索,TosLoc方法能够对单个项目的所有代码实现快速缺陷定位.通过在4个常用的真实Java项目上进行实验,TosLoc方法能够在检索速度和准确性上超越已有基准方法.与最优基准方法DreamLoc相比,TosLoc方法在消耗DreamLoc方法35%的检索时间下,平均MRR值比DreamLoc方法提高了2.5%,平均MAP值提高了6.0%. 展开更多
关键词 缺陷定位 缺陷报告 信息检索 深度学习 检索空间
在线阅读 下载PDF
基于历史缺陷信息检索的语句级软件缺陷定位方法 被引量:3
13
作者 岳雷 崔展齐 +2 位作者 陈翔 王荣存 李莉 《软件学报》 EI CSCD 北大核心 2024年第10期4642-4661,共20页
软件在开发和维护过程中会产生大量缺陷报告,可为开发人员定位缺陷提供帮助.基于信息检索的缺陷定位方法通过分析缺陷报告内容和源码文件的相似度来定位缺陷所在位置,已在文件、函数等粗粒度级别上取得了较为精确的定位效果,但由于其定... 软件在开发和维护过程中会产生大量缺陷报告,可为开发人员定位缺陷提供帮助.基于信息检索的缺陷定位方法通过分析缺陷报告内容和源码文件的相似度来定位缺陷所在位置,已在文件、函数等粗粒度级别上取得了较为精确的定位效果,但由于其定位粒度较粗,仍需要耗费大量人力和时间成本检查可疑文件和函数片段.为此,提出一种基于历史缺陷信息检索的语句级软件缺陷定位方法STMTLocator,首先检索出与被测程序缺陷报告相似度较高的历史缺陷报告,并提取其中的历史缺陷语句;然后根据被测程序源码文件与缺陷报告的文本相似度检索可疑文件,并提取其中的可疑语句;最后计算可疑语句与历史缺陷语句的相似度,并进行降序排列,以定位缺陷语句.为评估STMTLocator的缺陷定位性能,使用Top@N、MRR等评价指标在基于Defects4J和JIRA构建的数据集上进行对比实验.实验结果表明,相比静态缺陷定位方法BugLocator,STMTLocator在MRR指标上提升近4倍,在Top@1指标上多定位到7条缺陷语句;相比动态缺陷定位方法Metallaxis和DStar,STMTLocator完成一个版本缺陷定位平均消耗的时间减少98.37%和63.41%,且具有不需要设计和执行测试用例的显著优势. 展开更多
关键词 软件调试 缺陷定位 信息检索 缺陷报告
在线阅读 下载PDF
基于推荐列表的缺陷文件识别
14
作者 王昭丹 邹卫琴 刘文杰 《计算机科学》 CSCD 北大核心 2024年第S01期802-809,共8页
缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查... 缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查从而找到真正有缺陷的文件,这增加了定位的时间和成本。为解决这个问题,提出了一个相应的解决方案。首先运行主流的基于信息检索的静态缺陷定位技术来获得一个初始的可疑文件推荐列表;然后依据问题特性提出3类领域特征,并基于这3类特征构建一个机器学习模型,尝试从列表中识别出真正有缺陷(Truly Buggy)的源代码文件。在4个开源项目(Zoo-Keeper,OpenJPA,Tomcat,AspectJ)的2558个bug上进行了实验,结果表明,在最初可疑文件推荐列表上可以获得72.6%~80.7%的真正有缺陷的文件预测准确率。同时探究了3类特征子集及各个特征在预测真正有缺陷的文件上的重要性,发现缺陷报告与源代码的关系特征更重要。 展开更多
关键词 缺陷报告 缺陷定位 机器学习 信息检索 缺陷文件
在线阅读 下载PDF
基于领域知识微调的缺陷报告严重性预测
15
作者 陈冰婷 邹卫琴 +1 位作者 蔡碧瑜 刘文杰 《计算机科学》 CSCD 北大核心 2024年第S01期835-841,共7页
有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的... 有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的问题。对此,提出一种基于领域知识微调的缺陷报告严重性预测方法。利用能充分考虑文本上下文语义的BERT预训练模型,并使用缺陷报告数据对其进行模型微调使其学习到相关的领域知识。微调后的BERT模型用于抽取缺陷报告的语义特征,随后使用支持向量机进行严重性预测模型的构建。在Mozilla,Eclipse和Apache选取的共计15个项目上进行的实验表明,在准确率、召回率和F1值上,相较传统的信息检索方法,所提方法分别能提升4.5%~22.0%,3.0%~22.0%,4.0%~22.0%;相较通用BERT模型,微调后的BERT模型的准确率、召回率和F1值分别能够提高2.0%~5.1%,1.9%~5.1%,1.8%~5.0%。 展开更多
关键词 词嵌入 BERT 预训练模型 缺陷报告 微调 严重性预测
在线阅读 下载PDF
基于主题一致性保持和伪相关反馈库扩展的缺陷报告重构方法
16
作者 刘文杰 邹卫琴 +1 位作者 蔡碧瑜 陈冰婷 《计算机科学》 CSCD 北大核心 2024年第7期1-9,共9页
为了加快开发人员定位软件缺陷,研究人员提出了一系列基于文本检索的缺陷定位技术,自动为用户所提交的缺陷报告推荐可疑的代码文件。由于用户的专业知识不同,编写的缺陷报告质量不一致,因此某些低质量的缺陷报告无法被成功定位。对低质... 为了加快开发人员定位软件缺陷,研究人员提出了一系列基于文本检索的缺陷定位技术,自动为用户所提交的缺陷报告推荐可疑的代码文件。由于用户的专业知识不同,编写的缺陷报告质量不一致,因此某些低质量的缺陷报告无法被成功定位。对低质量的缺陷报告进行重构从而改进其定位效果,是常见的解决方案。现有基于查询扩展和查询缩减的主流重构方法,容易出现重构前后查询主题不一致或所依赖伪相关库质量差导致重构质量低的问题。对此,提出了一种基于主题一致性保持和伪相关反馈库扩展的缺陷报告重构方法,由主题一致性保持的查询缩减阶段和伪相关反馈库扩展的查询扩展阶段两部分组成。查询缩减阶段将缺陷报告的概要问题描述和从问题描述文本中提取的关键词合并来解决主题不一致性问题;查询扩展阶段综合使用多种定位工具(即Lucene, BugLocator和Blizzard)来获得伪相关反馈库,并从中提取查询扩展关键词,以解决现有伪相关反馈库质量差导致的重构质量低的问题;最后将查询缩减和扩展阶段的输出合并得到重构后的查询。通过在6个Java项目上进行实验发现,对于使用现有缺陷定位方法无法在TOP 10可疑推荐文件中定位的低质量缺陷报告,使用所提重构方法后,能定位其中21%~39%的缺陷即Accuracy@10,MRR@10为10%~16%。对比现有重构技术,所提重构方法在Accuracy@10和MRR@10两个指标上分别可以提升7%~32%和2%~13%。 展开更多
关键词 缺陷定位 查询重构 查询缩减 查询扩展 伪相关反馈库 缺陷报告质量
在线阅读 下载PDF
基于高斯过程的缺陷定位方法 被引量:10
17
作者 陈理国 刘超 《软件学报》 EI CSCD 北大核心 2014年第6期1169-1179,共11页
在软件系统中,缺陷定位是缺陷修复的一个关键环节,如果能将缺陷自动定位到很小的范围,将会极大地降低缺陷修复的难度.基于高斯过程提出了一种缺陷定位方法(GPBL),即针对每个缺陷,向开发人员推荐这个缺陷可能存在于哪些源文件中,从而帮... 在软件系统中,缺陷定位是缺陷修复的一个关键环节,如果能将缺陷自动定位到很小的范围,将会极大地降低缺陷修复的难度.基于高斯过程提出了一种缺陷定位方法(GPBL),即针对每个缺陷,向开发人员推荐这个缺陷可能存在于哪些源文件中,从而帮助开发人员快速修复缺陷.为了验证方法的有效性,采集了开源软件Eclipse和Argouml中的数据,实验结果表明,高斯过程缺陷定位的查全率和查准率平均分别为87.16%和78.90%.与基于LDA的缺陷定位方法进行比较,表明高斯过程更能准确定位缺陷的位置. 展开更多
关键词 缺陷定位 缺陷修复 缺陷报告 推荐方法 高斯过程
在线阅读 下载PDF
基于深度学习的安全缺陷报告预测方法实证研究 被引量:11
18
作者 郑炜 陈军正 +2 位作者 吴潇雪 陈翔 夏鑫 《软件学报》 EI CSCD 北大核心 2020年第5期1294-1313,共20页
软件安全问题的发生在大多数情况下会造成非常严重的后果,及早发现安全问题,是预防安全事故的关键手段之一.安全缺陷报告预测可以辅助开发人员及早发现被测软件中潜藏的安全缺陷,从而尽早得以修复.然而,由于安全缺陷在实际项目中的数量... 软件安全问题的发生在大多数情况下会造成非常严重的后果,及早发现安全问题,是预防安全事故的关键手段之一.安全缺陷报告预测可以辅助开发人员及早发现被测软件中潜藏的安全缺陷,从而尽早得以修复.然而,由于安全缺陷在实际项目中的数量较少,而且特征复杂(即安全缺陷类型繁多,不同类型安全缺陷特征差异性较大),这使得手工提取特征相对困难,并随后造成传统机器学习分类算法在安全缺陷报告预测性能方面存在一定的瓶颈.针对该问题,提出基于深度学习的安全缺陷报告预测方法,采用深度文本挖掘模型TextCNN和TextRNN构建安全缺陷报告预测模型;针对安全缺陷报告文本特征,使用Skip-Gram方式构建词嵌入矩阵,并借助注意力机制对TextRNN模型进行优化.所构建的模型在5个不同规模的安全缺陷报告数据集上展开了大规模实证研究,实证结果表明,深度学习模型在80%的实验案例中都优于传统机器学习分类算法,性能指标F1-score平均可提升0.258,在最好的情况下甚至可以提升0.535.此外,针对安全缺陷报告数据集存在的类不均衡问题,对不同采样方法进行了实证研究,并对结果进行了分析. 展开更多
关键词 安全缺陷 安全缺陷报告预测 深度学习 文本挖掘
在线阅读 下载PDF
面向软件仓库挖掘的数据驱动特征提取方法 被引量:4
19
作者 李晓晨 江贺 任志磊 《计算机科学》 CSCD 北大核心 2015年第9期159-164,共6页
在软件仓库挖掘领域,通常将软件工程任务转换成数据挖掘问题进行解决。领域特征的使用严重影响了软件任务的解决效果。然而,如何根据特定任务从软件仓库数据中提取有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。数据驱动特征提取... 在软件仓库挖掘领域,通常将软件工程任务转换成数据挖掘问题进行解决。领域特征的使用严重影响了软件任务的解决效果。然而,如何根据特定任务从软件仓库数据中提取有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。数据驱动特征提取方法是一种新的特征提取方法。对于给定的软件工程任务,该方法从任务的数据集中选取部分数据(如源代码、缺陷报告等),招募若干志愿者人工完成该任务,并要求志愿者说明在人工完成特定软件工程任务时所考虑的因素。通过分析这些因素,可以提取所需的领域特征。以缺陷报告摘要任务为例进行实验,结果表明新方法能够发现高效的领域特征,并取得比现有方法更好的预测效果。 展开更多
关键词 软件仓库挖掘 数据驱动方法 特征提取 缺陷报告摘要
在线阅读 下载PDF
软件缺陷报告严重性属性分析 被引量:5
20
作者 刘文杰 江贺 《计算机工程与应用》 CSCD 北大核心 2019年第14期48-53,208,共7页
软件缺陷报告的严重性对缺陷的解决具有关键作用。随着软件规模的不断扩大,使用开源的软件缺陷跟踪系统成为海量缺陷信息数据的主要处理方法。分析缺陷报告严重性在数据仓库中的作用,是处理软件缺陷的重要内容。通过对Bugzilla缺陷跟踪... 软件缺陷报告的严重性对缺陷的解决具有关键作用。随着软件规模的不断扩大,使用开源的软件缺陷跟踪系统成为海量缺陷信息数据的主要处理方法。分析缺陷报告严重性在数据仓库中的作用,是处理软件缺陷的重要内容。通过对Bugzilla缺陷跟踪系统数据的研究和分析,发现不同项目的属性特征差异较大,同时在修复率、解决时长、开发者、组件等属性上的统计特征具有一致性。对Mozilla项目和Eclipse项目的数据进行系统分析,并根据不同组件和项目中严重性程度分布情况,认为软件缺陷报告严重性程度的提升会导致缺陷修复率的提高,同时严重性程度为normal级别的缺陷解决时长最短,开发者持有缺陷的数量越高其修复率越低。 展开更多
关键词 计算机应用技术 开源软件 缺陷报告 严重等级 解决方案 修复率
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部