开发者质量信息在缺陷预测中的效用分析

来源 :南京大学 | 被引量 : 0次 | 上传用户:yiyiyaya13575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检测软件系统中潜在的缺陷往往相当困难并且需要花费高昂的代价。为缓解此问题,人们试图使用缺陷预测模型来识别一个软件系统中包含潜在缺陷的模块。近年来,研究者主要利用两种类型的度量来建立缺陷预测模型:代码度量(代码规模和复杂度等)和过程度量(开发者数量和历史修改次数等)。许多研究结果表明,过程度量通常比代码度量具有更好的缺陷预测性能,其原因在于过程度量考虑了开发者的行为而代码度量只考虑代码自身的结构特性。在软件工程领域,开发者的行为已被公认对软件质量有着重要的影响。特别地,最近的一些研究表明,那些考虑开发者经验(即开发者所贡献代码量的百分比)的过程度量表现出很好的缺陷预测能力。然而,直觉上对软件质量有重要影响的开发者质量在现有过程度量中却出乎意料地被忽视了。为探明开发质量信息在缺陷预测中的效用,本文首先通过开发者的历史缺陷引入百分比来量化开发者质量,然后利用量化后的开发者质量信息定义用来刻画文件质量的八种文件质量度量,最后通过实验分析这八种文件质量度量在缺陷预测中的有效性。在多个开源软件系统上的实验结果表明:(1)这些文件质量度量捕获了现有过程度量所未能捕获的软件开发过程信息;(2)大部分文件质量度量和软件缺陷以期望的方向显著相关;(3)这些文件质量度量与现有过程度量的组合通常能够显著地提升缺陷预测的性能。本文的实验结果证实了开发者质量对软件质量有着重要的影响,因此在进行软件缺陷预测时应该考虑开发者质量信息。
其他文献
首先,论文详尽、深入的分析了UML建模语言的产生、发展、内容以及成为一种面向对象标准建模语言过程.然后从数据库建模有角度上比较了ERD和UML优缺点,研究了UML数据库建模方
近年来,随着语义网技术在众多领域的广泛应用,语义数据以惊人的速度迅速增长。大规模语义数据中包含了很多复杂的隐含信息,这些隐含信息对语义分析应用具有非常重要的价值。
该文采取模式匹配技术对基于特征的邮件和网页病毒检测系统进行了深入的研究.首先,该文研究了在网页病毒和邮件病毒中占主导地位的脚本病毒.分析了脚本语言的特点及脚本病毒
该文的第一章介绍了框架技术以及相关概念;第二章概述了对商业领域进行领域分析的过程;第三章给出了基于DSSA的商业领域软件框架的总体设计、遇到的问题以及解决方案;第四章
近年来,伴随着无线网络及智能终端技术的迅猛发展,移动互联网提供的服务越来越全面、体验越来越周到,并逐渐成为新型应用的主流平台。其中移动流媒体业务以简单、直观的特点
银行的业务办理网络化,是银行业务的发展趋势.郑州农业银行业务数据交换系统,是按照中国农业银行总行全国借记卡联网工程统一安排的,主要解决农业银行发行的世纪通宝借记卡在
作者在报告中就宽带网络技术的几个问题进行了分析和研究.报告分为3个部分.在前言部分,作者分析了当前宽带技术的几个热点现象.其中包括宽带泡沫、NGN和3G.作者从自己的角度
聚类分析作为数据挖掘的重要分析方法,在许多现实应用中起到了很好的作用.它不仅可以作为数据挖掘分析系统的一个独立组成部分,对数据进行分析处理.也可以作为其它数据挖掘分
该文主要从光传送网的结构和管理的角度,总结了前人研究成果,提出有效的设计和管理方法.该文的主要研究内容和创新点包括:研究和探讨了光传送网的传送功能结构,描述了光传送
该论文通过对现有系统及数据交换机制的分析和研究,并结合多个企业应用数据仓库的成功案例,提出了一种基于OMG CWM规范,具有标准的数据和元数据交换接口的数据仓库体系结构.