基于信息检索的软件多特征缺陷定位方法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:flyballball
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件开发过程中,用户或测试人员在发现被测软件异常情况后,会提交描述相关问题的缺陷报告,开发人员需要仔细分析缺陷报告并查看众多源代码以找到原因,需要大量的时间和精力。为了提高整个软件团队的效率和生产力,研究人员提出了自动化的缺陷定位方法和工具,旨在定位这些包含缺陷的源代码文件,以供开发人员使用。基于信息检索的缺陷定位方法通过从缺陷报告和源代码中提取基本信息,计算缺陷报告与源代码之间的相似性,对源代码文件进行排序,实现对含有缺陷的源代码文件的自动推荐。然而,这些技术在性能上仍有较多的可提升空间,在实践中难以得到推广和应用。针对上述问题,本文以缺陷报告和源代码为研究对象,从改善查询源和应用特征分析的角度,研究基于信息检索的多特征缺陷定位方法,提高缺陷定位的性能。本文主要研究内容和成果如下:第一,由于目前基于信息检索的缺陷定位法存在较多的不良查询问题,在现有分类重构方法的研究基础上,提出一种针对不良查询的自动查询重构方法,首先在伪相关反馈过程中选择文本附件进行扩展,缓解了不良查询的数量过大问题。然后使用基于两种启发式规则的动宾短语过滤方法,减少在查询重构期间可能成为噪音的词,改善了输入查询源,从而提高缺陷报告不良查询的质量。第二,针对含有自然语言的缺陷报告和含有程序语言的源代码之间存在语言不匹配问题,使用特征分析的手段来改良缺陷定位模型,从文本相似性、缺陷倾向性、协同过滤性和版本变更性等多个方面,结合改进的向量空间模型r VSM进行多特征提取,使用多层感知器将缺陷报告和源代码文件间的文本相似度与高级抽象概念联系起来,得到一种潜在相似度,实现对可疑的源代码文件的排序推荐。第三,针对现有研究存在语义失配和表征不足的问题,提出了一个基于词嵌入和多尺度卷积神经网络MCNN的缺陷定位解决方案,首先使用基于wiki语料库的word2vec预训练模型和MCNN自动提取语义特征,采用非固定大小的多尺度卷积核,解决文本深层次特征提取不充分的问题。然后基于抽象语法树和MCNN提取源代码的结构特征,避免源代码句法结构特征的缺失。利用神经网络融合多个相似度特征,得到缺陷报告与源代码相似度量。另外通过引入Focal loss损失函数,解决缺陷定位中类别不平衡的问题。在实验中与其他模型相比,验证模型具有相对更优秀的软件缺陷定位性能。
其他文献
滨水空间在提高人民生活质量、改善城市微气候环境方面有着积极重要意义。严寒地区四季变化分明且冬季持续时间较长,滨水空间的微气候变化复杂,从而带来舒适度降低和空间活力下降等问题。本文以改善滨水空间微气候环境为切入点,比较分析不同空间环境影响因素下的滨水空间微气候环境状况,从而对提升城市滨水空间微气候环境提出优化策略。通过实地调研,选取了不同地表类型、不同植被布置形式以及不同空间结构布置作为滨水空间微气
无人机在民用及军事领域发挥着巨大作用,各类应用与数量与日俱增。随着无人机的增多和新一代无线通信技术的进步,其通信需求越来越高。通信频谱是一种十分紧缺、不可再生的自然资源。未来无人机会因为频谱资源紧张影响到其正常通信。为解决该问题,需要为其通信寻找有用的频谱资源。频谱共享技术可以提高频谱利用率,解决频谱资源浪费严重的问题。在频谱共享之前,提前对可能的空闲频段进行预测,有降低能量损耗、减少感知时延等优
近十年,我国老龄化程度快速升高,但目前老年电动代步车的没有统一安全规范,这给老年人在社区出行造成了极大的隐患,为积极应对我国人口老龄化过中老年人代步出行的安全与便捷问题,本文采用了相对传统驻车制动系统性能及工况适应性能更高的电子刹车系统(EPB),利用EPB收集不同路况的地面附着条件利用情况,使用不同的驻车制动策略,基于代步车的动力学模型还并配合能量回收策略,极大地提升了老年代步车的安全与效率,具
与单无人机作业相比,多无人机协同作业能完成许多更加丰富复杂的任务,而位置信息作为无人机实现导航控制所必需的关键信息,其精度以及可靠性对多于无人机协同作业的重要性不言而喻。在多无人机系统中,除了传统的GNSS观测信息外,还可以利用上无人机间的相对观测信息,例如相对距离观测信息,从而实现无人机之间的协同定位。本文围绕多无人机之间位置信息的求解问题,设计了一种基于GNSS/UWB的分布式协同定位方法。在
单脉冲雷达以其精确的测量角度和强大的抗干扰能力广泛应用于各项军事领域中。本文针对单脉冲雷达角度欺骗干扰技术进行研究,提出了一种基于多元矢量合成技术的多天线矢量合成假目标角度欺骗干扰方法,推导并研究了该干扰模型,并以无人机为载体平台进行了电磁仿真分析,验证了该干扰模型的有效性和可行性。本文首先介绍了比幅和比相单脉冲雷达测角原理,并对能实现单脉冲雷达有效角度欺骗干扰的反向交叉眼干扰技术进行了分析,讨论
随着对粒子操控的探索,人们开始关注阵列结构光场,以期同时操纵多个粒子,提高粒子操纵的效率。而在阵列结构光场中,涡旋光的相互干涉会产生诸多特性,这为粒子操纵提高了自由度。本文以涡旋光的相互干涉产生带涡旋的阵列光场为研究课题,研究了不同形式的涡旋光干涉,主要研究内容分为三个部分。第一部分研究了一种等振幅聚焦涡旋光,该涡旋光在常见的圆环形光场外产生了多圈次级圆环光场。使用这种结构光进行多光束离轴干涉,随
高频振荡(high-frequency oscillations,HFOs)的出现常伴有癫痫病理活动的发生,且HFOs被报道在癫痫手术中有临床应用价值。HFOs包括涟波(ripples,80~250Hz)和快速涟波(fast ripples,FRs;250-500 Hz),其中FRs被认为可反映癫痫网络活动和癫痫放电传播通路。但新近研究表明,在定位与癫痫发作相关的病理区域时,超快速涟波(very
单倍剂量不足(Haploinsufficiency)是指基因中一个等位基因突变或缺失,另一个等位基因正常表达,但该基因所翻译后的蛋白表达量只有正常蛋白表达水平的一半,不足以维持该基因正常的生理功能,进而导致人类多种疾病发生的基因型。其导致的疾病包括癌症、神经系统疾病、发育障碍、免疫疾病、代谢紊乱等。NF1抑癌基因突变可形成单倍剂量不足基因型,进而导致I型神经纤维瘤病,严重威胁患者生命安全。目前,临
随着铁路运输需求的增大以及我国高速铁路建设对速度与平稳度的要求,对钢轨检测的效率与精度的要求越来越高。目前铁路现场多数采用手工测量工具对钢轨进行检测,甚至依靠目测对钢轨损伤情况进行检查,手工测量工具与人眼观察的工作效率低、劳动强度高、对检测人员的依赖程度较高,且检测数据不便于数字化管理。常用的手工测量工具使用的是接触式测量方法,容易造成工具与钢轨接触点的磨损,需要时常对工具进行保养与校准。随着计算
目前,脑电技术正快速发展,随着神经成像技术的不断发展,我们能够更为深入地探索人脑的工作原理以及生理机制。与此同时,随着科技的不断发展,出现了许多不同的应用工具,例如脑电图(electroencephalography EEG),脑磁图(magnetoencephalography MEG),以及磁共振(Magnetic Resonance Imaging MRI)都获得了长足的发展。对比其他技术,