跨版本软件缺陷预测技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:qq121450500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测技术可以预先识别出软件模块中潜藏的缺陷信息,指导测试资源分配和管理决策。在跨版本的软件缺陷预测中,新版本软件常因没有足够的标记样本而使用前序版本数据进行训练学习,但前序版本的特征信息通常具有“滞后性”——相似特征属性的模块完成缺陷修复后仍被预测为存在缺陷。本文针对跨版本缺陷预测中存在“高维小样本”的问题,提出了相应的解决思路:针对无关特征和冗余特征的挖掘问题,提出了一种基于聚类分析结果进行特征子集选择的方法;针对新版本软件中“小样本”的问题,引入基于实例迁移的思想,利用前序版本数据进行更为有效的缺陷预测。主要工作如下:(1)针对软件缺陷预测时样本特征维度高、特征相互之间有冗余造成的搜索空间大、预测精度低等问题,提出了一种结合聚类分析和子集选择的特征选择算法:首先对样本数据集进行聚类分析,得到聚类结果,然后基于样本聚类的结果,进行包装式特征子集选择,得到最优特征子集。通过聚类方法解决了子集搜索时搜索空间大的问题,包装式子集选择则进一步降低了特征间的冗余度。在NASA公开数据集上的实验表明本文方法能有效降低特征子集的冗余率,并能有效提高预测模型的性能。(2)针对新版本软件预测时训练数据少的问题,引入基于实例迁移的思想,提出了改进Boosting方法:在模型训练过程中,加入改进的误分类代价,动态调整前序版本中样本的权重,选择对目标版本预测有利的样本,降低误分类样本对模型的干扰。同时结合软件版本演化过程中与缺陷相关的变更度量元,对目标版本进行缺陷预测。通过在公开数据集上对预测模型进行验证,结果证实该方法有效地改进了预测模型的性能。(3)实现了一个跨版本软件缺陷预测系统,通过集成不同的数据预处理方法、特征选择方法以及分类学习算法,组成100条学习规则,可以针对不同的数据集选择最佳的组合算法,达到最优的预测效果。
其他文献
介绍了彩叶植物的定义和分类、应用原则、绿化配置方式,并对色调搭配及彩叶植物在园林中的应用前景进行阐述,为彩叶植物的推广种植提供参考。
我省荥阳县盛产柿子,柿饼行销国内外,余下的柿子皮多弃之不用,既浪费资源,又污染环境。为此,本文论述了从柿子皮中提取柿果胶及糖浆的工艺研究,及其提取的基本方法。研究结果
文章就湘江长沙城区河段及橘子洲的历史和现状、橘子洲在该河段中的位置和作用、橘子洲岸线整治工程设计的特点、合理利用橘子洲应遵循的原则,以及设计经过定床和动床河工模型
介绍了我国童装市场的消费状况及其特点,对广州童装市场进行全面调查,详细地分析广州童装市场所存在的问题,并就提高设计能力、合理的品牌定位等不足方面提出一些建议。
通过对江苏省52所培智学校语训课程的现状调查发现:语训课程形式以集体课为主,个别化训练低于预期;训练前后评估未引起足够重视;语训内容不能完全匹配于学生的障碍类型,缺乏
本文构建了一套单室生物电化学系统(Single chamber bioelectrochemical system, S-BES),利用其阴、阳极内部电子传递转移特征,实现了阳极产电和阴极硝酸盐还原去除的协同作
面对能源危机和环境污染这两大问题,新能源汽车因其节能环保的特点得到了越来越多的关注,成为了一个研究热点。电动汽车充电站也随着新能源汽车技术的发展而随之建立,针对电
目的:探讨中心静脉导管留置期间的各种并发症发生原因及影响因素,从而采取有效措施控制中心静脉导管留置期间并发症的发生方法:回顾性分析852例留置中心静脉导管患者的临床资
诚信是一种传统美德,也应是一种现代社会生活方式。调查发现,当前小学生诚信生活中存在着:不同群体小学生诚信水平差异显著,诚信道德知行脱节,不遵守诚信规则等问题。我们应
随着我国社会、经济高速发展,对各种能源的需求越发旺盛,水、电等能源消耗逐年增多。教学、科研消耗是高校能耗重要组成部分,如何在保证高校发展的前提下深化教学科研耗能管