基于主成分分析的软件缺陷预测研究

来源 :南京航空航天大学 | 被引量 : 3次 | 上传用户:wanfan001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发现和修正软件缺陷一直是软件开发与维护最昂贵的活动,因此软件缺陷预测是软件工程领域的一个重要研究方向,特别是用于解决现有工业低效甚至无效的软件测试和评论方法。准确预测出有缺陷倾向的软件模块可以帮助软件工程师在软件测试和维护阶段将有限的资源分配给那些最易存在缺陷的模块,从而提高测试效率,降低软件的维护成本。本文在研究缺陷预测时,主要的研究内容包括以下三个方面:  第一,基于主成分分布函数的软件缺陷预测模型。该模型采用主成分分布函数生成数据的方法解决缺陷预测中的数据不平衡问题,并与随机向下欠抽样相结合,使用分类回归树对数据进行缺陷预测。最后通过对比实验验证该模型的可行性与有效性。  第二,基于加权核主成分分析的软件缺陷预测模型。该模型针对基于主成分分布函数的缺陷预测模型中主成分分析降维效果不明显的问题,提出采用加权核主成分分析取代主成分分析,并用Tomek欠抽样取代原来的随机向下欠抽样,以防止丢失重要信息,最后同样通过实验对比说明该改进方法的有效性。  第三,基于主成分分析的PCA-Copula软件缺陷预测模型。针对软件缺陷预测中模型难以确定的问题,并结合Copula理论提出PCA-Copula模型。最后将PCA-Copula模型与经典的多元线性回归、逻辑回归、神经网络作对比分析,用以说明该模型的有效性和可行性。  最后,对以上三种缺陷预测模型的预测结果分别进行了总结,并对未来研究进行了展望。
其他文献
嵌入式系统是一种以应用为中心的专用计算机系统,对功能、可靠性、成本、体积、功耗有着严格要求。当前,功耗已经成为嵌入式系统设计中关键性的约束条件,而编译中的低功耗设计作
J.P.Costas于1966年提出的Costas阵列,即根据雷达和声纳系统中时间与频率延迟特性而设计的最佳离散信号,能够最准确地确定出目标靠近或背离的速度,因此在遥控、遥测等系统中
随着在线社会网络应用的发展,在线社会网络分析方法受到研究人员的关注。同时,社交网站产生海量关于用户朋友关系以及自身行为(例如用户观点、评论和照片等等)的数据。现今,
对文档资源的分类是知识管理研究领域的主要问题。从不同的认识出发,研究工作集中在如何对文档资源进行语义表述和统计度量两个方面。本文结合以上两种思路的特点,给出了一个
随着现代化科技的迅猛发展,实时系统与我们的日常生活也越来越密不可分。虽然有传统的安全措施来保障实时系统的安全性,但是还是会有意外发生。所以在系统发生意外之后还能提
软件企业面对激烈的信息化市场竞争,为了求生存,满足客户要求便成了其首要责任。依赖于软件质量、成本和进度的客户满意度,质量是首要支撑点,为此,通过对软件质量的评估来指导软件
集群就是通过高性能网络或局部网络将一组计算机节点互联,形成的具有单一系统映像的高性能、高可用性、高扩展性的计算机集群系统。监控是集群管理的核心任务。监控数据可用
电子商务应用能够从质量、成本和处理速度等方面来改善企业的经营,随之而来的是信息资源的安全性问题。协同商务平台作为电子商务应用的一个实例,同样有必要对其所面临的潜在
以农业专家系统为重要手段的智能化农业信息技术在我国得到了迅速发展,并将成为我国21世纪农业现代化的重要内容。结合天津农业信息化建设的需要,天津市科委启动了天津农业信
网络类型的增加和不同网络之间业务的不断融合引发了综合网络管理的问题,网络管理者希望能够以一种统一的界面、网管系统和操作实现对这些网络的管理,综合网络管理的首要问题