期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
High-Impact Bug Report Identification with Imbalanced Learning Strategies 被引量:6
1
作者 Xin-Li Yang David Lo +2 位作者 Xin Xia Qiao Huang Jian-Ling Sun 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期181-198,共18页
In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they oft... In practice, some bugs have more impact than others and thus deserve more immediate attention. Due to tight schedule and limited human resources, developers may not have enough time to inspect all bugs. Thus, they often concentrate on bugs that are highly impactful. In the literature, high-impact bugs are used to refer to the bugs which appear at unexpected time or locations and bring more unexpected effects (i.e., surprise bugs), or break pre-existing functionalities and destroy the user experience (i.e., breakage bugs). Unfortunately, identifying high-impact bugs from thousands of bug reports in a bug tracking system is not an easy feat. Thus, an automated technique that can identify high-impact bug reports can help developers to be aware of them early, rectify them quickly, and minimize the damages they cause. Considering that only a small proportion of bugs are high-impact bugs, the identification of high-impact bug reports is a difficult task. In this paper, we propose an approach to identify high-impact bug reports by leveraging imbalanced learning strategies. We investigate the effectiveness of various variants, each of which combines one particular imbalanced learning strategy and one particular classification algorithm. In particular, we choose four widely used strategies for dealing with imbalanced data and four state-of-the-art text classification algorithms to conduct experiments on four datasets from four different open source projects. We mainly perform an analytical study on two types of high-impact bugs, i.e., surprise bugs and breakage bugs. The results show that different variants have different performances, and the best performing variants SMOTE (synthetic minority over-sampling technique) + KNN (K-nearest neighbours) for surprise bug identification and RUS (random under-sampling) + NB (naive Bayes) for breakage bug identification outperform the Fl-scores of the two state-of-the-art approaches by Thung et al. and Garcia and Shihab. 展开更多
关键词 high-impact bug imbalanced learning bug report identification
原文传递
基于知识图谱的bug问题探索性搜索方法 被引量:8
2
作者 孙小兵 王璐 +2 位作者 王经纬 李斌 李宇 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1578-1583,共6页
软件bug问题在软件开发与维护过程中不可避免.然而软件历史库中的bug库与commit库之间没有直接的对应关系,并且随着bug信息、commit提交信息量的增长,搜索bug变得更加繁琐.本文提出一种基于知识图谱对bug问题进行探索性搜索的方法.通过... 软件bug问题在软件开发与维护过程中不可避免.然而软件历史库中的bug库与commit库之间没有直接的对应关系,并且随着bug信息、commit提交信息量的增长,搜索bug变得更加繁琐.本文提出一种基于知识图谱对bug问题进行探索性搜索的方法.通过建立bug报告、commit提交信息及相关人员(如:bug报告人、commit提交者等)信息的bug知识图谱,并结合探索性搜索的思想,不仅能准确搜索bug问题,还能提供相关辅助信息对bug问题进行探索性搜索,帮助软件开发人员更有效地理解和解决bug问题. 展开更多
关键词 bug报告 commit提交 知识图谱 探索性搜索
在线阅读 下载PDF
Automated Time Based Multi-Criteria Bug Triage Approach:Developer Working Efficiency and Social Network Based Developer Recommendation
3
作者 YADAV Asmita SINGH Kumar Sandeep 《Journal of Shanghai Jiaotong university(Science)》 EI 2024年第3期566-578,共13页
In software development projects,bugs are common phenomena.Developers report bugs in open source repositories.There is a need to develop high quality developer prediction model that considers developer work satisfacti... In software development projects,bugs are common phenomena.Developers report bugs in open source repositories.There is a need to develop high quality developer prediction model that considers developer work satisfaction,keep within limited development cost,and improve bug resolution time.To address and resolve bug report as soon as possible is the main focus of triager when a new bug is reported.Thus,developer work efficiency is an important factor in bug-fixing.To address these issues,a proposed approach recommends a set of developers that could potentially share their knowledge with each other to fix new bug reports.The proposed approach is called developer working efficiency and social network based developer recommendation(DweSn).It is a composite model that builds developers'profile by using developer average bug fixing time,work efficiency to fix variety of bugs,as well as the developer's social interactions with other developers.A similarity measure is applied between new bug and bugs in corpus to extract the list of capable developers from the corpus.The proposed approach only selects those developers who are active and less loaded with work.The developer with the highest profile score is assigned the bugs.We evaluated our approach on the subset of five large open-source projects including Mozilla,Netbeans,Eclipse,Firefox and OpenOffice,and compared it with the state-of-the-art.The results demonstrate that combination of developers'efficiency with their average bug fixing time and interactions in their social network gives good accuracy and efficiently reduces bug tossing length.This approach shows an improvement in prediction accuracy,precision,recall,F-score and reduced bug tossing length up to 93.89%,93.12%,93.46%,93.27%and 93.25%,respectively.The proposed approach achieved a 93%hit ratio and 93.34%mean reciprocal rank,indicating that our proposed triager is able to efficiently assign bugs to correct developers. 展开更多
关键词 open-source repository bug report bug assignment tossing length bug triager developer social network developer recommendation
原文传递
Bug localization based on syntactical and semantic information of source code
4
作者 YAN Xuefeng CHENG Shasha GUO Liqin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第1期236-246,共11页
The existing software bug localization models treat the source file as natural language, which leads to the loss of syntactical and structure information of the source file. A bug localization model based on syntactic... The existing software bug localization models treat the source file as natural language, which leads to the loss of syntactical and structure information of the source file. A bug localization model based on syntactical and semantic information of source code is proposed. Firstly, abstract syntax tree(AST) is divided based on node category to obtain statement sequence. The statement tree is encoded into vectors to capture lexical and syntactical knowledge at the statement level.Secondly, the source code is transformed into vector representation by the sequence naturalness of the statement. Therefore,the problem of gradient vanishing and explosion caused by a large AST size is obviated when using AST to the represent source code. Finally, the correlation between bug reports and source files are comprehensively analyzed from three aspects of syntax, semantics and text to locate the buggy code. Experiments show that compared with other standard models, the proposed model improves the performance of bug localization, and it has good advantages in mean reciprocal rank(MRR), mean average precision(MAP) and Top N Rank. 展开更多
关键词 bug report abstract syntax tree code representation software bug localization
在线阅读 下载PDF
Bug Prioritization Using Average One Dependence Estimator
5
作者 Kashif Saleem Rashid Naseem +3 位作者 Khalil Khan Siraj Muhammad Ikram Syed Jaehyuk Choi 《Intelligent Automation & Soft Computing》 SCIE 2023年第6期3517-3533,共17页
Automation software need to be continuously updated by addressing software bugs contained in their repositories.However,bugs have different levels of importance;hence,it is essential to prioritize bug reports based on... Automation software need to be continuously updated by addressing software bugs contained in their repositories.However,bugs have different levels of importance;hence,it is essential to prioritize bug reports based on their sever-ity and importance.Manually managing the deluge of incoming bug reports faces time and resource constraints from the development team and delays the resolu-tion of critical bugs.Therefore,bug report prioritization is vital.This study pro-poses a new model for bug prioritization based on average one dependence estimator;it prioritizes bug reports based on severity,which is determined by the number of attributes.The more the number of attributes,the more the severity.The proposed model is evaluated using precision,recall,F1-Score,accuracy,G-Measure,and Matthew’s correlation coefficient.Results of the proposed model are compared with those of the support vector machine(SVM)and Naive Bayes(NB)models.Eclipse and Mozilla datasetswere used as the sources of bug reports.The proposed model improved the bug repository management and out-performed the SVM and NB models.Additionally,the proposed model used a weaker attribute independence supposition than the former models,thereby improving prediction accuracy with minimal computational cost. 展开更多
关键词 bug report triaging PRIORITIZATION support vector machine Naive Bayes
在线阅读 下载PDF
浅析BUG管理
6
作者 李晓叶 《计算机光盘软件与应用》 2011年第19期108-108,共1页
在软件测试的过程中,BUG管理是一个很重要的环节,它是测试人员和开发人员之间的桥梁,对BUG进行有效的管理,能够提高项目团队的工作质量和效率。
关键词 软件测试 bug bug报告 bug管理
在线阅读 下载PDF
DBugHelper:分布式系统Debug协助工具
7
作者 张燕飞 张春熙 +1 位作者 李宇明 张蓉 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期153-164,共12页
对于大规模分布式系统的开发而言,其开发周期比较漫长,包括前期的开发、过程中的Debug、后期的维护和测试等.在整个开发周期中,Debug是一个非常关键和重要的环节,如何才能在短时间内找到最可靠的方法来解除bug成为一个重要的挑战.对于... 对于大规模分布式系统的开发而言,其开发周期比较漫长,包括前期的开发、过程中的Debug、后期的维护和测试等.在整个开发周期中,Debug是一个非常关键和重要的环节,如何才能在短时间内找到最可靠的方法来解除bug成为一个重要的挑战.对于系统开发人员来说,bug报告能非常有效地帮助其了解bug的所有特征信息,并找到能修复bug的方法.通过研究发现,许多大规模分布式系统之间具有较强的相关性和相似性,因而其bug的产生情况和修复方法也具有类似特征.开发人员可以利用已存在的修复bug的方案来协助修复与其一致或相近的bug.本文提出一个适用于大规模分布式系统的Debug协助工具——DBugHelper,能为某些大规模分布式系统的开发人员的bug修复提供比较有效、正确的帮助.DBugHelper将最新的bug报告进行文本处理,形成查询向量,并将大量已被修复的bug及其相关信息进行离线处理和缓存,从而为在线查询提供索引机制.通过将大量已修复的bug报告进行离线处理并同时减少在线处理的数据量,从而使其准确并快速地为系统开发人员提供必要的Debug协助工作,以此减少系统开发的周期与成本. 展开更多
关键词 大规模分布式系统 DEbug bug报告 协助
在线阅读 下载PDF
双视角数据下移动应用BUG报告识别方法研究
8
作者 彭春雨 郑尚 +2 位作者 邹海涛 于化龙 高尚 《江苏科技大学学报(自然科学版)》 CAS 2024年第1期68-74,88,共8页
为了快速而准确地识别其中的BUG报告将有助于开发人员对移动应用进行修复,通过调查移动应用运行的不同阶段,以用户反馈和问题报告两个视角为切入点,提出基于深度学习的移动应用BUG报告自动识别方法,即首先使用Word2Vec获取词向量,其次,... 为了快速而准确地识别其中的BUG报告将有助于开发人员对移动应用进行修复,通过调查移动应用运行的不同阶段,以用户反馈和问题报告两个视角为切入点,提出基于深度学习的移动应用BUG报告自动识别方法,即首先使用Word2Vec获取词向量,其次,构建Bi-LSTM网络获取高级文本特征,并通过注意力机制分配权重以捕获句子中对BUG报告识别起到关键作用的信息,最后获取问题报告的BUG标签.实验结果表明所提方法在准确率、召回率、F1-score和查准率上均有提高,有助于开发人员准确识别移动应用的BUG报告,提高BUG修复效率. 展开更多
关键词 移动应用 软件维护 问题报告 用户反馈 bug标签
在线阅读 下载PDF
汽车12V蓄电池亏电原因及应对措施研究
9
作者 田丽娟 《汽车电器》 2025年第3期63-66,共4页
文章针对汽车12V蓄电池亏电的问题,解析造成亏电的主要原因,包括充电不足、过度使用车辆和车辆异常工作。针对每一种主要原因提出对应的解决方案,包括优化系统控制策略、提高电池充电接受能力、手机APP主动提示、智能熔断丝盒主动断电、... 文章针对汽车12V蓄电池亏电的问题,解析造成亏电的主要原因,包括充电不足、过度使用车辆和车辆异常工作。针对每一种主要原因提出对应的解决方案,包括优化系统控制策略、提高电池充电接受能力、手机APP主动提示、智能熔断丝盒主动断电、ECU主动复位及故障数据上报等技术。 展开更多
关键词 汽车蓄电池 亏电 主动断电 主动复位 故障上报
在线阅读 下载PDF
强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法
10
作者 谢琪 刘彦辰 《西南民族大学学报(自然科学版)》 2025年第3期298-307,共10页
自动重复软件缺陷检测是缺陷处理流程中的关键环节,其性能直接影响缺陷解决的整体效率.针对现阶段研究中预训练模型的长度限制问题和特征单一问题,提出一种强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法.该方法通过结合BiLST... 自动重复软件缺陷检测是缺陷处理流程中的关键环节,其性能直接影响缺陷解决的整体效率.针对现阶段研究中预训练模型的长度限制问题和特征单一问题,提出一种强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法.该方法通过结合BiLSTM-Attention机制与Longformer预训练模型,增强对篇章级文本的长程语义信息捕捉能力,从而提取更准确的语义相似度特征.其次,针对结构化元数据类别信息,构建特征提取网络以抽取类别相似度特征.最终,将上述特征与词组重叠特征融合后训练分类模型,以实现高效的重复缺陷报告检测.通过在Bugzilla、JIRA和GitHub平台的Eclipse、NetBeans、OpenOffice、Hadoop和VSCode项目上进行实验,结果表明,与基线方法相比,所提方法在F1分数和Accuracy上分别平均提升了2.40%和2.12%,在跨平台场景下实现了更优的检测性能. 展开更多
关键词 重复软件缺陷报告检测 Longformer 语义相似度 长程依赖
在线阅读 下载PDF
基于高斯过程的缺陷定位方法 被引量:10
11
作者 陈理国 刘超 《软件学报》 EI CSCD 北大核心 2014年第6期1169-1179,共11页
在软件系统中,缺陷定位是缺陷修复的一个关键环节,如果能将缺陷自动定位到很小的范围,将会极大地降低缺陷修复的难度.基于高斯过程提出了一种缺陷定位方法(GPBL),即针对每个缺陷,向开发人员推荐这个缺陷可能存在于哪些源文件中,从而帮... 在软件系统中,缺陷定位是缺陷修复的一个关键环节,如果能将缺陷自动定位到很小的范围,将会极大地降低缺陷修复的难度.基于高斯过程提出了一种缺陷定位方法(GPBL),即针对每个缺陷,向开发人员推荐这个缺陷可能存在于哪些源文件中,从而帮助开发人员快速修复缺陷.为了验证方法的有效性,采集了开源软件Eclipse和Argouml中的数据,实验结果表明,高斯过程缺陷定位的查全率和查准率平均分别为87.16%和78.90%.与基于LDA的缺陷定位方法进行比较,表明高斯过程更能准确定位缺陷的位置. 展开更多
关键词 缺陷定位 缺陷修复 缺陷报告 推荐方法 高斯过程
在线阅读 下载PDF
基于深度学习的安全缺陷报告预测方法实证研究 被引量:11
12
作者 郑炜 陈军正 +2 位作者 吴潇雪 陈翔 夏鑫 《软件学报》 EI CSCD 北大核心 2020年第5期1294-1313,共20页
软件安全问题的发生在大多数情况下会造成非常严重的后果,及早发现安全问题,是预防安全事故的关键手段之一.安全缺陷报告预测可以辅助开发人员及早发现被测软件中潜藏的安全缺陷,从而尽早得以修复.然而,由于安全缺陷在实际项目中的数量... 软件安全问题的发生在大多数情况下会造成非常严重的后果,及早发现安全问题,是预防安全事故的关键手段之一.安全缺陷报告预测可以辅助开发人员及早发现被测软件中潜藏的安全缺陷,从而尽早得以修复.然而,由于安全缺陷在实际项目中的数量较少,而且特征复杂(即安全缺陷类型繁多,不同类型安全缺陷特征差异性较大),这使得手工提取特征相对困难,并随后造成传统机器学习分类算法在安全缺陷报告预测性能方面存在一定的瓶颈.针对该问题,提出基于深度学习的安全缺陷报告预测方法,采用深度文本挖掘模型TextCNN和TextRNN构建安全缺陷报告预测模型;针对安全缺陷报告文本特征,使用Skip-Gram方式构建词嵌入矩阵,并借助注意力机制对TextRNN模型进行优化.所构建的模型在5个不同规模的安全缺陷报告数据集上展开了大规模实证研究,实证结果表明,深度学习模型在80%的实验案例中都优于传统机器学习分类算法,性能指标F1-score平均可提升0.258,在最好的情况下甚至可以提升0.535.此外,针对安全缺陷报告数据集存在的类不均衡问题,对不同采样方法进行了实证研究,并对结果进行了分析. 展开更多
关键词 安全缺陷 安全缺陷报告预测 深度学习 文本挖掘
在线阅读 下载PDF
面向软件仓库挖掘的数据驱动特征提取方法 被引量:4
13
作者 李晓晨 江贺 任志磊 《计算机科学》 CSCD 北大核心 2015年第9期159-164,共6页
在软件仓库挖掘领域,通常将软件工程任务转换成数据挖掘问题进行解决。领域特征的使用严重影响了软件任务的解决效果。然而,如何根据特定任务从软件仓库数据中提取有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。数据驱动特征提取... 在软件仓库挖掘领域,通常将软件工程任务转换成数据挖掘问题进行解决。领域特征的使用严重影响了软件任务的解决效果。然而,如何根据特定任务从软件仓库数据中提取有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。数据驱动特征提取方法是一种新的特征提取方法。对于给定的软件工程任务,该方法从任务的数据集中选取部分数据(如源代码、缺陷报告等),招募若干志愿者人工完成该任务,并要求志愿者说明在人工完成特定软件工程任务时所考虑的因素。通过分析这些因素,可以提取所需的领域特征。以缺陷报告摘要任务为例进行实验,结果表明新方法能够发现高效的领域特征,并取得比现有方法更好的预测效果。 展开更多
关键词 软件仓库挖掘 数据驱动方法 特征提取 缺陷报告摘要
在线阅读 下载PDF
软件缺陷报告严重性属性分析 被引量:5
14
作者 刘文杰 江贺 《计算机工程与应用》 CSCD 北大核心 2019年第14期48-53,208,共7页
软件缺陷报告的严重性对缺陷的解决具有关键作用。随着软件规模的不断扩大,使用开源的软件缺陷跟踪系统成为海量缺陷信息数据的主要处理方法。分析缺陷报告严重性在数据仓库中的作用,是处理软件缺陷的重要内容。通过对Bugzilla缺陷跟踪... 软件缺陷报告的严重性对缺陷的解决具有关键作用。随着软件规模的不断扩大,使用开源的软件缺陷跟踪系统成为海量缺陷信息数据的主要处理方法。分析缺陷报告严重性在数据仓库中的作用,是处理软件缺陷的重要内容。通过对Bugzilla缺陷跟踪系统数据的研究和分析,发现不同项目的属性特征差异较大,同时在修复率、解决时长、开发者、组件等属性上的统计特征具有一致性。对Mozilla项目和Eclipse项目的数据进行系统分析,并根据不同组件和项目中严重性程度分布情况,认为软件缺陷报告严重性程度的提升会导致缺陷修复率的提高,同时严重性程度为normal级别的缺陷解决时长最短,开发者持有缺陷的数量越高其修复率越低。 展开更多
关键词 计算机应用技术 开源软件 缺陷报告 严重等级 解决方案 修复率
在线阅读 下载PDF
基于主题模型的Ubuntu操作系统缺陷报告的分类及分析 被引量:3
15
作者 周凯 任怡 +3 位作者 汪哲 管剑波 张芳 赵言亢 《计算机科学》 CSCD 北大核心 2020年第12期35-41,共7页
软件缺陷(Bug)是造成系统失效的主要原因之一,为了更好地开发软件与修复软件失效,需要对缺陷的分布等特征有更好的理解。Ubuntu是一款得到广泛应用的开源软件,也是Linux操作系统当前在全球最成功的发行版之一。利用缺陷报告来发掘软件... 软件缺陷(Bug)是造成系统失效的主要原因之一,为了更好地开发软件与修复软件失效,需要对缺陷的分布等特征有更好的理解。Ubuntu是一款得到广泛应用的开源软件,也是Linux操作系统当前在全球最成功的发行版之一。利用缺陷报告来发掘软件缺陷特征,对缺陷进行合理分类并分析操作系统常见缺陷的分布规律及特点,对于基于Ubuntu的国产混源操作系统开发、测试及维护过程中的代码质量分析及提升具有重要参考价值。首先,获取Launchpad上32805份Ubuntu操作系统的缺陷报告。然后,采用主题模型分析Ubuntu上常见的缺陷,并结合操作系统的组成特点将其分为内核相关异常、桌面环境异常、网络相关异常、硬件驱动相关异常以及上层应用及开发环境相关异常。进一步,利用F1值对分类结果进行评估,结果表明缺陷分类具有较好的准确率。最后,通过分析缺陷报告统计结果得到Ubuntu操作系统的近期缺陷的一般分布规律和特点,同时通过缺陷报告的分类结果,得到了有助于进一步认知Ubuntu操作系统缺陷的相关发现和结论。 展开更多
关键词 Ubuntu操作系统 LDA模型 缺陷分类 缺陷报告分析
在线阅读 下载PDF
面向软件缺陷报告的提取方法 被引量:1
16
作者 林涛 高建华 +2 位作者 伏雪 马燕 林艳 《计算机科学》 CSCD 北大核心 2016年第6期179-183,共5页
软件工程中的软件缺陷报告数量在快速增长,开发者们越来越困惑于大量的缺陷报告。因此,为了达到缺陷修复和软件复用等目的,有必要研究软件缺陷报告的提取方法。提出一种提取方法,该方法首先合并缺陷报告中的同义词,然后建立空间向量模型... 软件工程中的软件缺陷报告数量在快速增长,开发者们越来越困惑于大量的缺陷报告。因此,为了达到缺陷修复和软件复用等目的,有必要研究软件缺陷报告的提取方法。提出一种提取方法,该方法首先合并缺陷报告中的同义词,然后建立空间向量模型,使用词频反文档频率以及信息增益等文本挖掘的方法来收集软件缺陷报告中单词的特征,同时设计算法来确定句子复杂度以选择长句,最后将贝叶斯分类器引入该领域。该方法可以提高缺陷报告提取的命中率,降低虚警率。实验证明,基于文本挖掘和贝叶斯分类器的软件缺陷报告提取方法在接受者工作特征曲线面积(0.71)、F-score(0.80)和Kappa值(0.75)方面有良好效果。 展开更多
关键词 软件缺陷报告管理 文本挖掘 贝叶斯分类器 软件缺陷报告特征 空间向量模型 句子复杂度
在线阅读 下载PDF
基于缺陷修复历史的两阶段缺陷定位方法 被引量:5
17
作者 王旭 张文 王青 《计算机系统应用》 2014年第11期99-104,共6页
缺陷定位是软件缺陷修复的关键步骤.随着计算机软件的日趋复杂和网络的迅速发展,如何快速高效的定位缺陷相关代码成为了一个急待解决的问题.在研究现有基于信息检索技术的缺陷定位方法的基础上,综合考虑缺陷修复历史信息,提出了基于缺... 缺陷定位是软件缺陷修复的关键步骤.随着计算机软件的日趋复杂和网络的迅速发展,如何快速高效的定位缺陷相关代码成为了一个急待解决的问题.在研究现有基于信息检索技术的缺陷定位方法的基础上,综合考虑缺陷修复历史信息,提出了基于缺陷修复历史的两阶段缺陷定位方法.该方法不再单一依赖文本相似度,从缺陷修复的局部性现象入手,更多的考虑了缺陷修复的历史记录、变更信息及代码特征等因素,结合信息检索和缺陷预测方法来提高缺陷定位的精度.最后本文以两个开源项目为例,验证了方法的可行性和有效性. 展开更多
关键词 缺陷定位 信息检索 缺陷修复 缺陷报告
在线阅读 下载PDF
基于知识图谱的跨项目安全缺陷报告预测方法 被引量:2
18
作者 郑炜 刘程远 +4 位作者 吴潇雪 陈翔 成婧源 孙小兵 孙瑞阳 《软件学报》 EI CSCD 北大核心 2024年第3期1257-1279,共23页
安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属... 安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属于新启动的项目,没有足够的已标记安全缺陷报告供在实践中构建此软件安全漏洞预测模型.一种简单的解决方案就是使用迁移模型,即利用其他项目已经标记过的数据来构建预测模型.受到该领域最近的两项研究工作的启发,以安全关键字过滤为思路提出一种融合知识图谱的跨项目安全缺陷报告预测方法KG-SBRP(knowledge graph of security bug report prediction).使用安全缺陷报告中的文本信息域结合CWE(common weakness enumeration)与CVE Details(common vulnerabilities and exposures)共同构建三元组规则实体,以三元组规则实体构建安全漏洞知识图谱,在图谱中结合实体及其关系识别安全缺陷报告.将数据分为训练集和测试集进行模型拟合和性能评估.所构建的模型在7个不同规模的安全缺陷报告数据集上展开实证研究,研究结果表明,所提方法与当前主流方法FARSEC和Keyword matrix相比,在跨项目安全缺陷报告预测场景下,性能指标F1-score值可以平均提高11%,除此之外,在项目内安全缺陷报告预测场景下,F1-score值同样可以平均提高30%. 展开更多
关键词 软件安全 安全缺陷报告预测 跨项目 知识图谱 领域知识
在线阅读 下载PDF
深度学习在缺陷修复者推荐中的应用 被引量:8
19
作者 胡星 王千祥 《计算机科学与探索》 CSCD 北大核心 2017年第5期700-707,共8页
目前许多软件项目使用缺陷追踪系统来自动化管理用户或者开发人员提交的缺陷报告。随着缺陷报告和开发人员数量的增长,如何快速将缺陷报告分配给合适的缺陷修复者正在成为缺陷快速解决的一个重要问题。分别使用长短期记忆模型和卷积神... 目前许多软件项目使用缺陷追踪系统来自动化管理用户或者开发人员提交的缺陷报告。随着缺陷报告和开发人员数量的增长,如何快速将缺陷报告分配给合适的缺陷修复者正在成为缺陷快速解决的一个重要问题。分别使用长短期记忆模型和卷积神经网络两种深度学习方法来构建缺陷修复者推荐模型。该模型能够有效地学习缺陷报告的特征,并且根据该特征推荐合适的修复者。通过与传统机器学习方法(如贝叶斯方法和支持向量机方法)进行对比,该方法可以比较有效地在众多开发者中找出合适的缺陷修复者。 展开更多
关键词 缺陷追踪 缺陷报告分配 深度学习
在线阅读 下载PDF
重复软件缺陷报告检测方法综述 被引量:3
20
作者 郑炜 王晓龙 +4 位作者 陈翔 夏鑫 廖慧玲 刘程远 孙瑞阳 《软件学报》 EI CSCD 北大核心 2022年第6期2288-2311,共24页
软件缺陷在软件的开发和维护过程中是不可避免的,软件缺陷报告是软件维护过程中重要的缺陷描述文档,高质量的软件缺陷报告可以有效提高软件缺陷修复的效率.然而,由于存在许多开发人员、测试人员和用户与缺陷跟踪系统交互并提交软件缺陷... 软件缺陷在软件的开发和维护过程中是不可避免的,软件缺陷报告是软件维护过程中重要的缺陷描述文档,高质量的软件缺陷报告可以有效提高软件缺陷修复的效率.然而,由于存在许多开发人员、测试人员和用户与缺陷跟踪系统交互并提交软件缺陷报告,同一个软件缺陷可能被不同的人员报告,导致了大量重复的软件缺陷报告.重复的软件缺陷报告势必加重人工检测重复缺陷报告的工作量,并造成人力物力的浪费,降低了软件缺陷修复的效率.以系统文献调研的方式,对近年来国内外学者在重复软件缺陷报告检测领域的研究工作进行了系统的分析.主要从研究方法、数据集的选取、性能评价等方面具体分析总结,并提出该领域在后续研究中存在的问题、挑战以及建议. 展开更多
关键词 缺陷报告 重复检测 深度学习 自然语言处理 信息检索
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部