不完全监督软件缺陷预测技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:winterryliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的高速发展,软件的规模和复杂度在不断提升,软件缺陷带来的经济损失和测试代价十分之高,利用软件缺陷预测技术可以对有缺陷趋势的模块进行预测,帮助开发人员合理分配测试资源。但是构建有效的缺陷预测模型往往需要获取成本极高的缺陷标记数据,如果可以充分利用未标注的数据或者现有的已标注其他项目数据信息,可以有效减少缺陷预测模型的应用成本。本文从弱监督学习角度出发,对不完全监督的软件缺陷预测技术进行了研究,其主要内容如下:第一,面向半监督学习的工作量感知即时缺陷预测技术。由于即时缺陷预测可以在变更级的粒度上对缺陷进行预测,引起了大量研究人员的研究兴趣。变更的缺陷标记很难获取,因此不依赖于标记信息的缺陷预测模型更有应用价值,但是由于监督信息的匮乏,以前的工作提出的无监督模型在分类场景下性能很差。本文从半监督学习角度对即时缺陷预测进行研究,提出了一个基于样本选择的工作量感知三体训练模型。在六个开源项目上的实验结果表明,工作量感知三体训练法的性能优于现有的即时缺陷预测方法。第二,面向异构特征的跨项目软件缺陷预测技术。跨项目软件缺陷预测技术可以利用现有的已标注缺陷数据集对新的无标记项目进行预测,但需要两者之间具有相同的度量集合,难以用于实际开发。异构缺陷预测技术可以在具有异构度量集合的项目间进行缺陷预测,该技术引起了大量研究人员的关注。现有的异构缺陷预测技术利用朴素的或者传统机器学习方法为源项目和目标项目学习特征表示,所学习到的特征表示能力很弱且缺陷预测性能很差。鉴于深度神经网络强大的特征抽取和表示能力,本文基于变分自编码器技术提出了一种面向异构缺陷预测的特征表示方法。该模型结合了变分自编码器和最大均值差异距离,能有效的学习源项目和目标项目的共性特征表示,基于该特征表示可以训练出有效的缺陷预测模型。通过在多组缺陷数据集与传统跨项目缺陷预测方法及异构缺陷预测方法的比较验证了该方法的有效性。最后,基于变分自编码器的跨项目软件缺陷预测系统。为了鉴别所学的特征表示的好坏,基于提出的跨项目软件缺陷预测方法,本文实现了一个通用跨项目软件缺陷预测系统。该系统可以同时处理同构及异构特征的跨项目软件缺陷预测问题,并且可以展现训练过程中两个项目数据分布的变化情况。通过该系统对隐式特征分布的展示可以进一步验证本文所提方法的有效性。
其他文献
区块链作为一种新兴的分布式存储技术,能够实现数据的多方共享与维护,为数据共享提供安全、可信的环境。然而,随着近年来区块链研究的逐步深入,其自身的安全问题日益显露,区块链数据隐私保护逐渐成为热门的研究课题。联盟链Hyperledger Fabric(以下简称“Fabric”)作为最广泛应用的区块链平台之一,采用授权的方式限制节点访问数据,但在数据存储机密性和隐私性上缺乏合适的解决方案。本文针对Fab
雨是现实生活中非常普遍的天气,不仅影响人类的视觉,而且还会严重影响户外视觉系统的性能,包括视频监控,物体检测和自动驾驶等等。随着计算性能的提高以及深度学习理论的发展,图像去雨任务已经取得了许多突破性的进展。但是同样存在背景模糊、雨痕残留等问题。本文对现有的图像去雨方法的优缺点以及适用范围进行总结。针对现实场景下的图像去雨问题,本文重点研究了雨痕图像的特点,提出了基于分解的循环生成式对抗网络的图像去
非接触心率检测算法存在较为成熟的体系框架,通过摄像头采集目标面部信息,完成不接触待测者便能获取心率特征的任务工作,能够在较大程度上解决传染性病人、行动不便的患者、老人与婴幼儿的健康监测,同时也能作为情绪分类评估的指标,具有一定的研究价值。然而大多数的框架任务研究的内容偏向于微动、静止一类的情况,本文旨在建立剧烈运动状态场景下的心率监测的有效框架。(1)在原始ROI亮度信息采集的基础上,额外获取五官
随着移动互联网技术的快速发展和智能手机的大量普及,利用智能手机进行毒品交易、传播网络谣言,电信诈骗等犯罪行为日益猖獗。面向智能手机的数字取证可以有效地帮助司法部门收集犯罪证据。在所有的智能手机平台中,Android系统凭借其开源性和功能多样性等特点,占据了市场的主导地位,因此,针对Android智能手机的取证技术研究具有重大现实意义。由于Android生态环境的开放性,导致Android移动设备的
图像检索作为一项互联网信息处理的重要任务,面临着海量数据带来的挑战。传统的检索方法根据关键字检索,在处理海量图像数据时并不适用,为了解决这个问题,提出了基于内容的图像检索方法。在基于内容的图像检索技术中,图像内容的表达和相似性度量由计算机进行自动的处理,相比较采用文本进行图像检索所面临的缺陷,充分发挥了计算机长于计算的优势,由此大大提高了检索的效率。哈希检索方法是其中的代表性算法,它将图像以二进制
目标跟踪是计算机视觉领域的一个基础的、重要的且极具挑战性的研究方向。近年来,随着计算机硬件的高速发展以及性能优异的算法研究成果的出现,目标跟踪技术在商业、医学、军事等领域发挥着越来越重要的价值。然而由于目标被遮挡、目标发生形变、环境光照变化、背景中存在与目标相似的物体等干扰因素的存在,目前的算法在复杂场景下的跟踪表现并不理想。因此,本文针对复杂场景下的高鲁棒性目标跟踪问题,从基于相关滤波框架的跟踪
近年来,随着三维激光扫描仪以及低成本传感器的普及,使得三维点云数据可以更加快速且容易地获得。三维点云数据具有简单、灵活和强大的表示能力,现如今三维点云模型的应用越来越广泛,例如机器人、增强现实、自动驾驶、智能制造、计算机艺术等。然而,由于扫描设备自身精度不够等原因,通过扫描得到的点云数据不可避免地包含大量的噪声点,因此点云去噪成为下游应用的基础和挑战。为此,本文以散乱点云为研究对象,从局部与非局部
反射阵列天线由于具有成本低、重量轻、易于加工、可波束扫描等优点被广泛应用于卫星通信和雷达系统中。本文主要围绕反射阵列天线进行研究,主要包括两种新型宽带反射阵列天线的设计,低剖面折叠反射阵列天线的设计及其结构简单且低成本的波束扫描方法的实现。本文的主要工作内容如下:1、设计了一种基于单层偶极子加载T-形支节单元结构的宽带反射阵列天线。首先设计了一个中心频率为10 GHz的角锥喇叭天线,作为反射阵列天
数字阵列雷达是阵列雷达中一种重要的新体制雷达,能够形成多个波束实现全方位扫描。圆柱阵雷达作为数字阵列雷达的一种形式,具有全方位多波束、高数据率的特点,这对信号处理提出了很高的要求。目前主要以FPGA和DSP作为常用的雷达信号处理平台,但由于其开发成本高、调试周期长、程序可移植性差,造成其更新换代困难。分析圆柱阵雷达信号处理流程发现,其信号处理过程中存在大量并行计算,而GPU在通用并行计算领域优势明
随着信息获取技术的进步,多视图数据变得无处不在,我们可以轻松地从异构特征空间获得具有多视图表示的数据。多视图聚类旨在利用多个视图间互补的信息和一致的信息来发掘数据中的固有结构。这类算法具有广阔的应用场景,如计算机视觉、自然语言处理、社交多媒体等等。因此多视图聚类在机器学习和数据挖掘领域受到越来越多地欢迎。虽然近年来已经提出了不少多视图聚类算法,并在特定领域取得了不错的效果,但是现有算法仍存在着一些