基于集成学习的软件缺陷预测方法的研究与应用

来源 :西南大学 | 被引量 : 0次 | 上传用户：yongsheng0550

【摘要】

：

如今计算机软件在各个领域都得到了广泛地应用,需求量持续增大,功能复杂性也越来越高。但随着系统规模的不断扩大,其质量问题也更加凸显,这时软件测试工作就显得尤为重要。软

【作者】

：

穆旭昀

【出处】

：

西南大学

【发表日期】

：

2004年期

【关键词】

：

缺陷预测特征选择类不平衡处理集成学习 AdaBoost算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

如今计算机软件在各个领域都得到了广泛地应用,需求量持续增大,功能复杂性也越来越高。但随着系统规模的不断扩大,其质量问题也更加凸显,这时软件测试工作就显得尤为重要。软件测试通常用来探测系统中存在的缺陷以避免严重事故的发生,但在实际的工作当中,受软件项目时间和人力成本等因素的影响,软件测试工作未能完全覆盖整个项目,因此软件中可能会包含隐藏缺陷。而在软件生命周期中,检测出内在缺陷的时间越晚,修复该缺陷的代价也就越高,如果在软件发布之后出现问题,检测和修复缺陷的代价将更大。因此,本文重点关注可以预先识别出可能含有缺陷的程序模块,并对其分配足够的测试资源的软件缺陷预测技术。目前的软件缺陷预测问题主要通过机器学习分析解决,本文通过研究该方向软件缺陷预测技术的特点,发现主要存在如下问题:1.软件缺陷数据中一般存在大量的冗余或者不相关特征,多余的数据特征会严重影响缺陷预测模型的性能;2.软件缺陷数据存在中严重的类不平衡现象,即正负类样本数据比例差别较大,这样会使模型泛化能力较差,失去模型构建的意义;3.目前软件缺陷预测可用分类器种类较多且大多为单一分类器,但该类算法的预测精度达到一定水平就会进入瓶颈期,继续优化算法难度较高;4.目前的软件工程环境复杂且多样,如何针对不同的开发环境、开发语言,构建出具有普遍性的软件缺陷预测系统势在必行。针对上述问题,本文从以下几方面开展了研究及工程工作:1.针对缺陷预测数据集中存在的冗余或者不相关特征问题,本文采用特征选择方法对特征进行优选,其中主要用信息增益率为数据集选择用于实验的最优特征。经过实验验证,该方法可以有效提升实验结果的精确性。2.针对缺陷预测数据集中存在的严重类不平衡问题,本文采用采样技术,其中主要包括过采样和欠采样。先通过过采样将少数类样本与多数类样本平衡,再通过欠采样去除多数类样本来达到数据集中正负类样本的平衡。经过实验验证,通过采样技术平衡实验数据可以有效提高模型泛化能力。3.针对缺陷预测实验中存在的单一分类器预测精度的问题。本文采用集成学习的思想,在软件缺陷预测领域首次集中引入集成算法Stacking、Bagging和AdaBoost,并采用LG、J48、NB和NN作为集成学习的基分类器。通过多种算法组合,发现对应基分类器集成后的实验效果比单一分类器实验效果好,并对比获取到具有最优实验效果的AdaBoost集成算法,且基分类器采用J48用于构建缺陷预测模型。4.研究成果的工程应用。基于前面的研究成果,本文设计、开发并建立了一个软件缺陷预测系统。同时将该系统用于两个开发语言、开发环境完全不同的软件项目的测试工作中,并将实验得到的缺陷预测结果与实际的软件缺陷情况对比。经过实验验证,该系统可有效对不同项目进行缺陷预测,这对实际的软件测试工作具有重要的工程应用价值。

其他文献

面向网络地图的矢量数据多层次表达与分析技术研究

随着互联网的飞速进步,传统的地理信息系统(GIS)已经发展到了网络阶段,即Web GIS。网络地图也已经逐步取代了传统的电子地图,以浏览器为展示窗口,得到越来越多用户的实时并发

学位

网络地图矢量数据曲线采样多层次表达空间检索日照分析

基于加权随机汇池网络的自适应算法研究

随机汇池网络作为冗余信息、有损压缩和随机噪声相互作用的一种网络,对生物神经编码、纳米电子学、分布式传感器网络、数字波束形成阵列、图像处理和社交网络等等大量领域具

学位

加权随机汇池网络自适应算法非稳态信号最小均方算法递归最小二乘算法

MIMO通信系统中基于压缩感知信号检测算法的设计

多输入多输出(MIMO)技术是5G无线通信系统关键技术的基础。多天线带来增益,随之而来的是对数据处理能力的高要求与硬件成本的不断增加。MIMO系统技术的发展多种多样,而空间调

学位

MIMO压缩感知信号检测广义空间调制

正负离子表面活性剂复配系统的双水相行为和相反转

本文以三亚甲基-α,ω-双(十二烷基二甲基溴化铵)(12-3-122+,2Br-)/十二烷基磺酸钠(Na+AS-)12-3-122+,2X-(X-= F-,Cl-,NO3-,CH3CO-(Ac-),1/2SO42-)/Y+AS-(Y+ = Na+,K+,Rb+)复

学位

正负离子表面活性剂相行为特异离子效应短链醇相反转

中央环保督察对企业环境信息披露水平的影响研究

中央环保督察是一项加快推进生态文明建设,体现环境保护党政同责的核心制度安排。自督察工作开展以来,不仅有力推动了地方党委和政府对环境保护工作的重视,督促其积极履行环

学位

中央环保督察环境信息披露运动型治理异质性检验

面向背景减除的低秩矩阵恢复算法的研究

背景减除是视频分析中的一个重要研究方向,是指将视频帧序列中的前景从背景中分离出来,可用于视频监控、人机交互、医学图像处理等各种视觉任务中。由于复杂场景和缺少先验知

学位

背景减除低秩矩阵恢复非凸松弛最大化方差

微服务架构协同开发规范与质量管理系统的设计与实现

随着近年软件体系架构的发展,微服务已经渐渐替代单体架构、垂直架构、SOA等成为软件体系架构标准,许多企业和开发者向微服务架构迁移。然而微服务也有其短板,为了实现更细的

学位

微服务协同开发持续集成数据管理监控告警

氧化物基荧光粉的部分氮化及其性能提升

本论文工作是通过AlN部分替代A1203,合成部分氮化的新型铝酸盐荧光材料,主要包括三个部分:SrAl2O4:Eu2+,Dy3+的部分氮化:在1500 ℃的还原气氛中,成功合成了单相的SrAl2O4-3xN

学位

荧光粉部分氮化光致发光热稳定性

高中生自主学习能力与学习成绩的实证研究

美国学者的研究证明自主学习能力(Self-Regulated Learning Ability)会对学生学习成绩产生较大影响[1]。然而,国内对自主学习能力与高中生学习成绩间的量化分析研究较少。通

学位

自主学习能力高中生学习成绩数学成绩量化分析

湛江近海域沉积物中DL-PCBs对斑马鱼免疫功能的影响

类二噁英多氯联苯(dioxin-like polychlorinated biphenyls,DL-PCBs)是全球性的有机污染物。DL-PCBs属于多氯联苯(polychlorinated biphenyls,PCBs),其性质和毒性与二噁英相

学位

近海域沉积物DL-PCBs免疫器官免疫细胞免疫因子斑马鱼

基于集成学习的软件缺陷预测方法的研究与应用

其他学术论文