面向软件众测的重复缺陷报告处理方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:suaixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件众测是一种新型的软件测试模式,主要基于众包技术将原本由公司内部专业测试人员完成的测试任务,通过众测平台分发给活跃在平台的众测工作者进行,众测工作者以提交缺陷报告(Bug Report)的形式反馈结果。众测相较于传统的软件测试具有测试周期短、测试成本低等特点,因此受到广泛追捧,具有十分广泛的应用前景。由于众测模式的本质是取决于大量的劳动力,众测工作者之间彼此独立,提交的缺陷报告往往存在大量的重复,因此对重复缺陷报告的处理研究成为一项十分重要的工作,现有的工作难以解决报告的文本稀疏性问题,也没有充分考虑到报告中文本和图像之间的关系,同时对重复缺陷报告的融合存在信息抽取的冗余性。针对以上问题,本文主要工作包括以下几个方面:(1)基于文本分析的重复缺陷报告检测:针对纯文本形式的缺陷报告在文本表示时会存在文本稀疏问题,本文工作一从深度文本聚类的角度,提出一种基于文本分析的重复缺陷报告检测模型,该模型可以为两个部分:1)文本表示层,使用双向长短时记忆网络作为报告文本的特征提取网络,并引入了自编码器的重构损失作为网络层损失;2)聚类层,使用K-means聚类算法对提取的文本特征进行聚类,并将KL散度(Kullback-Leibler Divergence)与最大分区置信度相结合作为聚类损失。在真实的众测数据集上的实验结果表明,该方法相较于基准方法性能有所提升。(2)融合文本与图像信息的重复缺陷报告检测:针对存在多模态数据的缺陷报告,如在一些移动设备应用的软件众测场景,众测人员由于输入设备的限制,提交的缺陷报告往往呈现少文本多截图的形式,如何同时考虑文本和图片的信息成为一个难点。针对此问题,本文工作二借鉴模态融合的思路,在工作一模型基础上加入图像特征提取层和模态融合层,图像特征提取层由VGG16网络结合SEnet(Squeeze-and-Excite network)模块构成。模态融合层用于融合图像特征和文本特征。区别于工作一,采用自编码器重构损失结合DCCA(Deep Canonical Correlation Analysis)损失作为网络层损失。实验结果表明,该方法在多项评价指标上优于对比方法。(3)重复缺陷报告的融合:重复缺陷报告虽然描述的是同一个软件缺陷(或Bug),但是它们之间并非简单的重复,往往存在着互补的信息,因此重复缺陷报告融合的目标是去除报告中冗余信息,提取有效信息。针对此问题,本文工作三从抽取式文本摘要的角度,将其建模为句子选择问题,提出一种基于质心的重复缺陷报告的融合模型,该模型通过词的TF-IDF(Term Frequency–Inverse Document Frequency)值以及Word Embedding构建质心,通过SIF(Smooth Inverse Frequency)技术构建句向量,并在基于句子的相似度构建的句图中进行谱聚类,最终从每个类中选取与质心最近的句子生成Bug摘要。实验结果表明,该方法对比其他重复缺陷报告融合的方法性能有显著的提升。
其他文献
经历改革开放以来四十多年的快速化城镇化进程,“人的城镇化”已然成为社会各界的共识,与此同时,互联网技术深刻地变革这城乡关系,城市与乡村之间由单向层级结构演化为城乡网络结构。现有关于人的城镇化研究,或是讨论以人为本的城镇化研究的路径、内涵与价值意义,或是从宏观视角讨论城镇化过程中宏观人口迁徙在地理空间上的特点,而对“人的城镇化”的动力机制层面关注不足,尤其是从微观个体视角出发的相关研究较少。由此,本
乡村农产品观光工厂是近年来出现的乡村新型建筑类型,对于乡村产业发展和全面振兴具有重要的价值和意义,对其设计进行的研究有助于保留传统文脉、催生集体记忆,塑造村民对村庄价值的自信心与认同感,从而促进城乡协调共生发展。本文的第一章绪论部分介绍了研究的背景对象、相关概念、目的意义、国内外研究综述,并提出本篇论文的研究方法和框架。第二章是观光工厂的基础研究,包含相关理论、发展模式、功能构成、设计规范、实际案
石墨烯是21世纪研究最广的材料之一,由于其卓越的综合性能,制备和应用日益受到关注。铜基化学气相沉积法是目前制备石墨烯最普及的方式之一,但要制备符合相应品质的石墨烯仍然较为困难。与此同时,尽管石墨烯性能优异,并被广泛应用于研究,但其在实际应用领域一直受到限制。本文从石墨烯的生长和制备出发,研究了少层石墨烯在铜箔防腐领域的作用,并将石墨烯作为OLED器件的阳极进行器件制备和性能测试。本文在石墨烯生长控
二维材料是指一类由单层或少层原子或分子层组成的,在一个维度上尺寸减小到极限的纳米材料,伴随着2004年石墨烯通过机械剥离法被成功制备,研究者对二维材料家族的探索开始不断深入,而二维材料的制备及其表征是这一领域极为重要的两大课题。本论文就沿着这两条研究线路分别展开。在制备方面,化学气相沉积法(CVD)是目前一种有望应用于大规模生产二维材料的可靠方法,它有可控性好,可重复性高,成本相对较低等优点,因此
祥林嫂——旧中国农村劳动妇女的典型形象。她勤劳、善良、质朴,具有·顽·强的生命力和·坚·韧的反抗精神,但·终·于受侮辱、受迫害。小说《祝福》正是通过对祥林嫂形象的塑造,深刻地揭露了封建礼教对劳动妇女的精神摧残和它的吃人本质,指出了彻底反封建的必要性。...
期刊
目的比较不同的穿刺活检方案对多参数磁共振(mp MRI)前列腺影像报告与数据系统(PI-RADS)评分4~5分患者的诊断效能。方法回顾性分析2018年1月至2020年2月南京大学医学院附属鼓楼医院378例前列腺PI-RADS评分为4~5分且接受前列腺靶向穿刺联合系统穿刺患者的临床资料。纳入研究的所有患者的穿刺活检操作均经会阴途径,在mp MRI/经直肠超声融合图像引导下,先行靶向穿刺,再行12针系
化石燃料的过度使用,导致了全球性的能源危机和环境污染问题。电催化技术是实现可持续化生产化学燃料而不产生有害副产物的有效途径之一。一方面可以通过电催化还原CO2,将其转化为水和化学燃料,从而降低CO2排放量;另一方面,电催化水分解作为电催化还原CO2的半反应,可以产生氢气(H2)和氧气(O2),提供可再生清洁能源。催化剂是实现高效电催化反应的关键因素,铁基反钙钛矿材料由于其丰富的物理性质以及灵活的成
自上世纪以来,高温超导材料作为未来极具应用前景的材料受到人们的广泛关注。但当前高温超导的物理机理仍然不清楚,有待进一步研究。5d过渡金属铱氧化物因其d轨道电子在强自旋轨道耦合效应与电子关联效应共同作用下而具有许多新奇的物理性质,有望通过电子掺杂而实现高温超导。铜基高温超导是基于铜原子的3d轨道电子,因此探索5d轨道电子对高温超导的机制研究具有重要意义。当前,对于5d铱氧化物的研究多集中于反铁磁型M
[研究背景]舌癌是最常见的一种口腔癌,近年来发病率也有逐渐增加的趋势。癌症的免疫疗法是是在手术治疗、放射治疗、化学药物治疗之后治疗癌症的新领域。已有研究证实肿瘤微环境与肿瘤的免疫逃逸密切相关。肿瘤微环境是肿瘤发生、生长的内外环境,是促进癌细胞增殖、存活、侵袭和迁移的必不可少的参与者。肿瘤微环境中淋巴细胞的浸润类型和PD-L1的表达与免疫治疗的预后密切相关。弥散加权成像技术(diffusion-we
【目的】基于健康信念模式自行设计、制定父母口腔健康信念问卷,对3~5岁儿童及其父母进行问卷调查,分析早期儿童龋齿现状及其影响因素。探究早期儿童龋齿对儿童口腔健康相关生活质量的影响,为有针对性地开展儿童口腔卫生健康教育活动和制定有效的防护措施提供依据。【方法】1.通过文献检索、小组讨论初步形成父母口腔健康信念问卷,经过两轮专家函询,根据专家提出的意见、专家的积极系数、权威系数以、协调程度等最终形成父