【摘 要】
:
软件缺陷预测能够在项目开发中预测出可能存在缺陷的软件模块并对其进行重点测试。当前,软件缺陷预测根据预测目标主要包括分类预测和回归预测。其中,分类预测能够判断软件模
论文部分内容阅读
软件缺陷预测能够在项目开发中预测出可能存在缺陷的软件模块并对其进行重点测试。当前,软件缺陷预测根据预测目标主要包括分类预测和回归预测。其中,分类预测能够判断软件模块中是否有缺陷,而回归预测能够判断软件模块中含有缺陷的数量。现有的研究工作主要关注分类预测,而回归预测尚未得到充分的研究。除此之外,共享研究人员的模型可以使其他研究人员重现实验结果,降低实现成本,减少重现方法时的人为错误,并在此基础上进行扩展和优化现有技术。但是,直接共享训练模型会存在泄漏训练数据隐私的风险。因此,亟需提出新方法以处理公开模型时涉及到的隐私数据泄露问题。针对回归预测问题,据我们所知,首次将无监督方法用于软件缺陷数预测中,该方法根据软件模块的度量值对模块进行排序,排在前面就代表有更多的缺陷数目,考虑了升序和降序两种排序策略。在实证研究中,使用基于实际开源项目搜集的数据集,将无监督方法用于软件缺陷数预测。首先设计实验从无监督方法中选取一个性能最好(基于FPA和Kendall指标)的方法LOC_D,然后将LOC_D和使用SMOTEND算法解决类不平衡问题的有监督方法比较,发现LOC_D性能要优于这些有监督方法。进一步改进SMOTEND算法,即提取出该算法的三个参数并使用差分进化算法做参数优化,实验结果表明差分进化算法可以进一步提升有监督方法性能,然后再将该方法和LOC_D比较,结果表明在大多数情况下LOC_D性能要更好。针对缺陷预测模型共享问题,据我们所知,首次从差分隐私角度入手进行研究。差分隐私是一种数据隐私保护技术,它可以改进传统机器学习算法,改进后算法构建的模型可以保护训练数据隐私。将差分隐私技术用于软件缺陷预测模型的共享,提出DP-Share算法。DP-Share算法以随机森林算法为基础,它首先对少数类使用过采样方法,然后对连续型特征进行离散化处理来优化随后的隐私预算分配,接着使用DP-Share-Sampling采样方法为子树构造训练集,最后集成这些子树形成随机森林。对于DP-Share算法同样使用搜集自开源项目的数据集,使用AUC作为评测指标,实验结果表明在使用相同隐私预算时,DP-Share方法在大部分情况下比基准方法DF-Enhance可以取的更好的性能。基于上述研究,对软件缺陷预测的后续研究给出两条建议。(1)在软件缺陷数预测时,发现无监督方法构造简单且性能较好,建议后续研究工作需要将无监督方法作为软件缺陷数预测的基线方法,(2)建议研究人员在共享软件缺陷预测模型时考虑使用差分隐私技术以保护训练数据的隐私。除此之外,设计了相关原型工具对上述方法进行了实现。
其他文献
低密度奇偶校验(Low Density Parity Check,LDPC)码是线性分组码中具有稀疏校验矩阵的一类码,已经被证实是继Turbo码后又一类接近香农限的纠错编码。准循环低密度奇偶校验(Qu
非负矩阵分解(NMF)有许多优良特性,在许多领域被广泛研究,包括模型、算法以及实际的应用研究。但是最先提出的NMF模型难以适用于不同的实际应用要求,于是出现了许多相关NMF模
猪链球菌(Streptococcus suis)是一种重要的人畜共患病病原,它严重威胁人类的健康,阻碍全球养猪业的经济发展。可根据细菌荚膜多糖的不同分为33个血清型(1-31型,33型和1/2型),其中,猪链球菌2型致病性最强。研究报道,猪链球菌4型(Streptococcus suis serotype 4,SS4)可导致人和动物发病甚至死亡,并且在我国已成为主要的流行血清型。目前,国内外对SS
随着移动通信技术和互联网的飞速发展,移动通信技术正经历从2G、3G过渡到4G的快速发展,移动用户数量呈爆发式增长。因WLAN具有不受线缆端口位置局限、组网简单快捷、低成本等
双级活齿传动结构简单紧凑、尺寸小、传动比范围大、传动效率高、承载能力大,非常适用于石油钻井和机器人等技术领域。本文围绕双级活齿传动从弹流润滑、效率、传热、温升和样机研制等方面进行了研究。依据弹性流体动压润滑理论,运用Dowson-Higginson公式,计算了双级活齿传动的最小油膜厚度,并根据膜厚比判断了其润滑状态,分析了参数对最小油膜厚度的影响。结果表明:双级活齿传动中活齿与滚道间是薄膜润滑,增
在网络高速发展的时代,人们可以通过各种渠道及时获取最新信息,而新闻则是信息传播的主要方式。其中,新闻评论通过对社会热点新闻发表见解和看法,起到引导大众正确行为的作用,是新闻不可或缺的组成部分。因此,新闻评论的准确翻译至关重要。在本次翻译实践中,笔者以《经济学人》杂志“By Invitation”栏目中与新冠疫情相关的新闻评论文本作为翻译来源,以卡特福德转换理论作为论文的理论指导,探讨总结适合新闻评
相对于传统的粗晶材料,纳米晶材料具有特异的力学行为,相对于纯金属,纳米晶固溶体材料因结构更为稳定而更具应用潜力和研究价值。随晶粒尺寸减小到数十纳米后,纳米晶材料的晶界数量显著增加,原有基于粗晶材料的位错强化机制理论已难以解释这类材料特殊的力学行为,其强化机制成为近年来的重要研究内容之一。近年来的研究发现,将纳米晶固溶体的各强化因子分别研究并区分其作用和权重,是揭示纳米晶固溶体强化机制的有效途径。然
随着镁合金在汽车、电子电器、航空航天等领域的广泛应用,在“节能减排、绿色环保”的社会主题下,对于废弃镁合金材料的再回收利用越来越受到关注。另外,镁合金用于LED灯等电子器件的散热器时,要求具有较好的散热性能和力学性能,因此需要开发出高强高导热性镁合金材料。本论文围绕废弃镁合金的再生利用及高强高导热镁合金的开发,首先,利用坩埚炉法回收熔炼了废弃镁合金材料,得到了再生AZ31镁合金(RMA)。其次用熔
在我们今天生活的社会中,能源危机日益严峻,人们必须找到经济、清洁的可再生能源来维持社会的进步和发展。超导材料科学发展已有百年,在电力、电子、医疗、磁学等多个领域展现出了巨大的应用前景。以电力领域为例,用超导材料制成的导电线可大幅度降低电力传输过程中的热损耗,提高经济效益。在多种超导材料中,YBCO因其优良的磁场和电场性能而获得人们的关注。多年来,世界各地的科研人员对其性能进行了全面的研究,而我们实
随着全球工业的迅速发展,机床设备逐渐向自动化、高速化和智能化的方向发展,然而机床的工作环境复杂,导致了机床刀具的磨损和颤振等情况的出现,严重影响着机床的加工精度,因此需要机床改进技术,使其能够及时的对故障做出判断,确保机床的安全运行。在车床切削颤振的研究中,切削颤振信号的检测分析、颤振特征的提取和颤振的判别方法尤为关键。因此,本文的主要研究内容如下:(1)通过动力学建模的方式对车床切削颤振机理进行