基于迁移学习的软件缺陷预测模型研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:solarshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测技术可以用于预测软件缺陷是否存在以及其可能存在的数目,以决定软件是否可以交付,对于软件性能的提升、质量的保证和测试成本的控制有着重要的意义。已有的软件缺陷预测模型大多利用机器学习算法进行训练和构建,传统机器学习的应用则存在缺少原始数据、数据之间不满足独立同分布等固有限制,这些限制条件制约了该项技术的发展。迁移学习可以较好的弥补这一缺陷。因此本课题针对迁移学习与缺陷预测相关算法进行了深入研究和优化。首先本文对迁移学习分类和软件缺陷预测的基础理论及相关技术进行了研究,并针对跨项目的软件缺陷预测问题,重点分析和研究了现有的软件缺陷分布预测技术。对相关技术的核心步骤进行了可优化性关键要素分析,具体包括数据预处理阶段的特征选择和构建预测模型的相关算法。然后在软件预测模型构建过程中,首先对数据预处理技术进行了研究和分析,基于过滤式特征选择方法和SMOTE抽样方法开展研究工作。然后针对TrAdaboost和Rareboost两个算法,分析了其样本权值变更和子分类器构建方式,对软件缺陷问题的不平衡性特征,设计出了一个新的TrRareboost算法,且对其合理性和正确性进行了分析。并结合Adaboost算法思想,对TrAdaboost的权重变更参数进行了优化设计,得到了一种新的迁移学习方法。最后本文通过设计一系列的实验,对多个数据集的测试来验证优化后的TrRareboost算法相比于TrAdaboost这一现有迁移学习算法的优越性,同时完成的实验还包括特征选择和数据抽样对预测结果的影响,以及TrRareboost同NN-filter迁移学习方法的预测结果对比。这些实验的结果也都验证了TrRareboost算法可以有效的提升软件缺陷预测模型的性能。本文为跨项目软件缺陷预测提供了一种新的算法和思路,有效的提高了软件缺陷预测模型的可用性,具有较好的应用价值,为这项技术应用到实际问题中贡献了自己的力量。
其他文献
近年来,随着生态文明建议步伐的加快和建设美丽中国的提出,政府生态责任的追究与落实已经成为政府实践和研究探讨的焦点。基于对当前政府生态责任理论研究的不足,提出政府生
《给一位交臂而过的妇女》是法国象征主义诗人波德莱尔表现现代城市“邂逅”题材的一首经典名诗。本雅明对这首诗情有独钟,并把它作为激发其写作“拱廊计划”和捕捉巴黎城市
桩和隧道之间的相互作用是一个复杂的土和结构相互作用问题,包括两个方面:隧道施工对已有桩基的影响,桩基施工和荷载对已有隧道的影响.简单介绍了这两方面的现有研究成果,重点
结肠癌是胃肠道系统中最常见的恶性肿瘤之一,其发病率和死亡率均居所有恶性肿瘤的第三位。近年来,我国结肠癌的发病率和死亡率呈明显上升趋势,且男性发病率要高于女性。然而,
党的十九大报告提出"实施乡村振兴战略",坚持农业农村优先发展,加快推进农业农村现代化,对我国的精准扶贫工作提出了新挑战和新目标。基于此,本文首先分析了乡村贫困内涵、贫
“意象油画”的理论来源于东方文化,是近代西方油画与东方文化相交融的结果。意象油画的创作与表现不是简单的用油画材料来摹绘表现国画,不是简单的“拿来我用”“生搬硬套”
近年来,计算机技术飞速发展,各类Web应用与产品也进入了农业领域,各个农业公司纷纷信息化,在公司中部署专门的计算机网络系统,将之应用到农业的生产、运输、销售等各个环节中。这就导致许多Web应用程序接入了农业公司的内部计算机系统,并且涉及私密和高敏感度信息。然而,在漏洞曝光平台上频频出现农业公司的身影证明这些信息并没有得到有效的保护。此外,各种新技术的发展与应用,也给农业公司的Web网络增添了新的威
《龙虾》是希腊导演欧格斯·兰斯莫斯的最新力作。在这部电影中,一个"理想"的社会被建构出来,婚姻成为社会中的最高价值与终极目的,而单身者作为社会中的异类则必须在一个酒
美国土地管理局是美国联邦政府关于公共土地上矿产资源政策的主要制定单位。2006年4月。土地管理局正式出台了新时期公共土地上矿产资源管理的政策要点,阐述了联邦政府在对待