AGED,全称为ArGument Extractor with Definitions in FrameNet,是最近提出的一种框架语义角色标注(FSRL)模型。该模型以框架和框架元素的定义为模板,在整个训练语料上使用预训练语言模型进行编码,是一种基于论元查询的FSRL模型。然而,...AGED,全称为ArGument Extractor with Definitions in FrameNet,是最近提出的一种框架语义角色标注(FSRL)模型。该模型以框架和框架元素的定义为模板,在整个训练语料上使用预训练语言模型进行编码,是一种基于论元查询的FSRL模型。然而,随着语料规模和模型参数的日益增加,AGED模型的训练和超参数调优变得相当耗时,进而影响了AGED模型的训练和调优效率。为此,该文在训练阶段引入集成学习方法,在调优阶段引入正交设计方法,提出了基于正则化m×2交叉验证(m×2 BCV)的AGED集成模型。具体地,在训练阶段,该文引入m×2 BCV和众数投票结合的集成学习方法,在整个训练语料上使用m×2 BCV构造多组训练子集和验证子集;然后利用并行训练技术和AGED模型生成多个AGED子模型;最后利用众数投票方法集成这些子模型,构造性能更优的AGED集成模型。在调优阶段,使用正交设计方法,以最大化验证集上F_(1)值为优化目标,从AGED集成模型的大量超参数组合中选出一部分具有代表性的超参数组合进行调优。实验结果表明,与AGED模型相比,提出的AGED集成模型在测试集上的F_(1)值可以提高1.34百分点,且训练时间仅占AGED模型的0.79倍,这充分验证了AGED集成模型的有效性。此外,该文也开展了消融实验,验证了AGED集成模型中引入的集成学习方法和正交设计方法的有效性。展开更多
在软件缺陷预测的回归建模中,由静态代码提取的类层面度量元(特征)以及由方法聚合(sum、avg、max、min)到类的特征往往较多,使用传统的特征选择方法(如AIC、BIC)通常先要确定了模型,不同的模型选出的特征集差异较大,且模型的可解释性差...在软件缺陷预测的回归建模中,由静态代码提取的类层面度量元(特征)以及由方法聚合(sum、avg、max、min)到类的特征往往较多,使用传统的特征选择方法(如AIC、BIC)通常先要确定了模型,不同的模型选出的特征集差异较大,且模型的可解释性差.最大信息系数MIC (maximal information coefficient)是Reshef等^([4])提出的度量两个连续变量之间相互依赖程度的一个指标,且有基于观测数据的计算办法.本文基于软件缺陷个数与各特征的MIC度量先选择特征,再对所选特征进行了适当的幂次变换,最后使用主成分泊松和负二项回归建模.本文实验基于NASA的KC1的类层面数据集,采用了m×2交叉验证的序贯t-检验来对两模型的性能差异的显著性进行检验,模型性能评价指标采用FPA、AAE、ARE.实验结果表明:1)基于MIC选出的特征主要是sum、avg、max三种聚合模式特征,与AIC、BIC方法有明显的差异;2)对特征做适当的幂次变换在多数模型下可以改善其性能;3)对特征做幂次变换后,做主成分分析与因子分析可以得到两个明显的因子,其一个因子正好对应avg与max聚合模式的特征集,另一个因子正好对应sum的聚合模式特征集,使得模型具有较好的可解释性.综合实验的各项指标可以得出,sum、avg、max三种聚合模式对软件缺陷预测有显著作用,且基于MIC所选特征而构造的模型是有优势的.展开更多
文摘AGED,全称为ArGument Extractor with Definitions in FrameNet,是最近提出的一种框架语义角色标注(FSRL)模型。该模型以框架和框架元素的定义为模板,在整个训练语料上使用预训练语言模型进行编码,是一种基于论元查询的FSRL模型。然而,随着语料规模和模型参数的日益增加,AGED模型的训练和超参数调优变得相当耗时,进而影响了AGED模型的训练和调优效率。为此,该文在训练阶段引入集成学习方法,在调优阶段引入正交设计方法,提出了基于正则化m×2交叉验证(m×2 BCV)的AGED集成模型。具体地,在训练阶段,该文引入m×2 BCV和众数投票结合的集成学习方法,在整个训练语料上使用m×2 BCV构造多组训练子集和验证子集;然后利用并行训练技术和AGED模型生成多个AGED子模型;最后利用众数投票方法集成这些子模型,构造性能更优的AGED集成模型。在调优阶段,使用正交设计方法,以最大化验证集上F_(1)值为优化目标,从AGED集成模型的大量超参数组合中选出一部分具有代表性的超参数组合进行调优。实验结果表明,与AGED模型相比,提出的AGED集成模型在测试集上的F_(1)值可以提高1.34百分点,且训练时间仅占AGED模型的0.79倍,这充分验证了AGED集成模型的有效性。此外,该文也开展了消融实验,验证了AGED集成模型中引入的集成学习方法和正交设计方法的有效性。
文摘在软件缺陷预测的回归建模中,由静态代码提取的类层面度量元(特征)以及由方法聚合(sum、avg、max、min)到类的特征往往较多,使用传统的特征选择方法(如AIC、BIC)通常先要确定了模型,不同的模型选出的特征集差异较大,且模型的可解释性差.最大信息系数MIC (maximal information coefficient)是Reshef等^([4])提出的度量两个连续变量之间相互依赖程度的一个指标,且有基于观测数据的计算办法.本文基于软件缺陷个数与各特征的MIC度量先选择特征,再对所选特征进行了适当的幂次变换,最后使用主成分泊松和负二项回归建模.本文实验基于NASA的KC1的类层面数据集,采用了m×2交叉验证的序贯t-检验来对两模型的性能差异的显著性进行检验,模型性能评价指标采用FPA、AAE、ARE.实验结果表明:1)基于MIC选出的特征主要是sum、avg、max三种聚合模式特征,与AIC、BIC方法有明显的差异;2)对特征做适当的幂次变换在多数模型下可以改善其性能;3)对特征做幂次变换后,做主成分分析与因子分析可以得到两个明显的因子,其一个因子正好对应avg与max聚合模式的特征集,另一个因子正好对应sum的聚合模式特征集,使得模型具有较好的可解释性.综合实验的各项指标可以得出,sum、avg、max三种聚合模式对软件缺陷预测有显著作用,且基于MIC所选特征而构造的模型是有优势的.