基于训练数据选择的跨项目软件缺陷预测方法研究

来源 :湖北大学 | 被引量 : 0次 | 上传用户:SFAFFDAF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网前所未有的发展,彻底改变了我们的生活方式,软件发挥的作用也随之越来越突出,已经渗透到我们生活的各个层面,从而导致人们对软件质量的要求也越来越高。众所周知,软件维护开销约占软件开发总费用的70%,软件缺陷预测与修复又是其中主要任务之一。软件缺陷预测有助于发现最可能潜在问题的模块,从而合理分配测试资源,改善软件开发过程,提高开发质量,一直是软件工程领域备受关注的热门主题。传统的软件缺陷预测方法是利用项目自身已有的历史数据建立预测模型,再然后用于后续版本的缺陷预测。高质量的预测模型要求有充足的历史数据,这对一些新项目或还不活跃的软件项目便难以满足。近年来,互联网上可供获取的数据资源越来越多,一些研究者提出利用其它相似软件项目的数据来做训练,构建跨项目的缺陷预测模型,用于解决传统缺陷预测对历史数据依赖的瓶颈。然而,已有工作在跨项目训练数据选择时大多以源代码度量指标的相似性为依据,却忽略了缺陷的属性信息,如缺陷的数量。事实上,在数据选择过程中,当存在多个训练实例与某一个目标实例有相同的相似度值时,需要确定应该优先选择哪个或者哪几个实例。从经验型软件工程角度而言,有更多缺陷数量的训练实例将被优先选择,因为这些实例包含的缺陷信息量更丰富。因此,本文通过引入缺陷数量信息,提出一种新的训练数据选择跨项目软件缺陷预测方法。主要包括如下几个方面(1)在常用的源代码度量指标基础上考虑引入具体的缺陷信息来计算实例间的相似度,同时对缺陷信息采用五种不同的比较典型的标准化方法。(2)探讨常用的三种相似度及(1)中对缺陷信息使用不同标准化方法,并且对选择出不同的训练实例的质量进行了探讨。(3)基于六个典型的单个分类器(LR、J48、NB、SVM、KNN和RF)建立缺陷预测集成模型,充分利用各个单一分类器的优势,并使用性能评价指标F-measure来综合评价分析各个分类器的预测性能,由此分别提出投票集成和加权集成来预测目标实例是否有缺陷。为了验证本文的思路的合理性及正确性,通过大量的实验比对,结果表明:(1)引入缺陷数量信息可以获得更好的预测结果,有利于提高跨项目缺陷数据的选取质量;(2)采用不同的相似性度量方法和标准化方法处理缺陷数据对预测结果有影响,其中使用曼哈顿距离度量实例源代码指标相似性或使用线性标准化方法处理缺陷数时预测性能效果更好;(3)对本文提出的预测模型进行加权集成,可进一步提高预测性能。
其他文献
对冲基金有两个特点,第一是追求绝对收益,第二是使用金融衍生品。对冲基金的发展,为银行等机构投资者提供了良好的资产配置标的。本文的重点是论述对冲基金组合(FOHF)在期货
党的十八大提出要加强和创新社会管理,构建具有中国特色的社会管理体系。作为人民团体重要组成部分的行业协会在创新社会管理中的作用和地位不断增强,尤其是关于意识形态领域
当前,我国经济发展进入新常态,经济发展速度转向中高速增长,经济发展要求提质、增效、升级。但我国发展面临着诸多问题和挑战,国际贸易摩擦、国内经济发展动力不足、生态环境恶化、社会矛盾突出等问题制约着我国发展水平向更高阶段迈进。在党的十八届五中全会第二次全体会议上,习近平同志适时地提出了“创新、协调、绿色、开放、共享”的新发展理念。新发展理念是包括新型城镇化发展在内的我国各方面事业高质量发展的指挥棒、红
5G(5th Generation)提出了两个最明显的需求,以用户为中心和更高的系统容量。在5G时代,运营商的运营、优化必然由以网络为中心向以用户为中心迁移。传统的QoS(Quality of Ser
作为人力资源管理的重要组成部分,绩效考核是当前研究的重点和难点,而绩效考核指标的构建和适当的评价方法又是绩效考核能否取得成功的关键。企业通过建立科学的的绩效考核指标体系,运用恰当的绩效考核方法,不仅有利于提升员工素质,增强自身履职能力,而且可以提高整个单位的竞争力。B银行县支行是B银行在县域地区的分支机构,近年来,县域支行在推动地方经济金融协调发展、改善金融服务和推进金融创新方面做出了重要贡献,但
为了满足中国联通业务发展的需要,从根本上解决综合采集工作中长期以来存在的问题,改善中国联通综合采集预处理系统能力,提高中国联通在日益复杂的市场环境中的核心竞争能力,
近年来,数据挖掘技术作为机器学习、人工智能、统计学等学科的交叉产物,已经成为数据研究领域的热点。越来越多的数据以流的形式出现在各个领域,例如:天气预测、网络搜索、网
随着信息技术的发展和科技力量的提升,移动通信系统不断升级,移动设备不断更新换代,移动互联网变得更加方便与快捷。现今,新媒体新技术的发展对高校图书馆提出了新的要求。图
在图像处理中,编辑图像的光照信息是一个基本问题,对图像的光照重建和编辑是图像处理和编辑的一个关键技术,并在计算机图形学和计算机视觉的研究中已成为一个热点话题。例如,
随着计算机技术和互联网技术的发展,电子文件已经深入人们生活的方方面面,成为生活中信息的重要载体。与此同时,从企业到个人,电子文件网络泄露事件导致的重要信息被窃取时有