基于深度学习模型的软件功能型克隆检测

来源 :南京大学 | 被引量 : 0次 | 上传用户:echo19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件克隆检测致力于找出两段功能相似的代码段,其对软件系统的维护和发展起着非常重要的作用。目前该领域存在很多研究试图有效检测软件克隆,他们多是基于代码段的文本或结构信息,手工提取代码段包含这些信息的特征。这种做法使其无法有效检测出软件功能型克隆,即只有功能相似而在句法和语法层面可能有很大差别的代码段。本文针对目前方法无法有效检测软件功能型克隆的现状,提出基于深度学习模型和监督信息的软件功能型克隆检测方法。本文首先将软件克隆检测问题形式化为一个监督学习问题,提出一个端到端的深度学习框架CDLH。CDLH利用训练集中代码段的监督信息指导深度学习模型,并根据编程语言的特点设计深度模型,使深度模型学习出的深度监督特征不仅包含代码段的句法和语法信息,同时包含了其功能信息。在真实数据集上的实验结果表明,所提方法能够有效地检测出功能型克隆。使用监督信息指导特征学习能学得包含代码段功能特点的特征,但在真实场景中进行软件克隆的标记时,领域专家一般只标记他们恰好发现的克隆对,而有大部分的未被发现的克隆对和非克隆对未被标记。因此本文提出在弱标记场景下的软件克隆检测问题应该被形式化为一个从只有正标记数据和无标记数据中进行的学习问题,即PU(Positive and Unlabeled)学习问题,并据此提出了一种能够利用未标记数据的方法CDPU。CDPU还利用了对抗训练机制来使模型更加鲁棒。在真实数据集上的实验结果表明所提方法能够在真实标记场景下有效检测出功能型克隆。
其他文献
整体式固体火箭冲压发动机作为一种新型的导弹推进系统,以其体积比冲高、推力系数大、易于小型化、使用维护性好等优点,可最大限度地满足新一代战术导弹的战术技术要求,通过
活性粉末混凝土这一高性能材料在桥梁工程中的应用实例越来越多,但活性粉末混凝土的高性能需高温养护才能实现,这也决定了其在桥梁工程中多应用于预制桥梁。在预制拼装桥梁中
随着电子商务的飞速发展,快递行业迎来了新的机遇,而城市配送作为快件物流配送中的重要环节将直接影响整个快递配送效率。针对目前城市快件配送服务多主体、配送资源碎片化、
由于强大的特征学习和特征表达能力,GAN在文本生成图像领域获得了巨大成功。虽然GAN具有很高的研究价值,但由于文本句子向量缺少在词语层面上的微度调整信息和对文本的理解,
随着计算机技术、自动控制技术的不断发展,移动机器人在各个行业获得广泛应用,也对机器人对环境的适应性和运行的稳定性提出了更高的要求。其中,物流机器人(AGV)作为移动机器
车型细类识别是智能交通系统领域中的一项重要研究课题,同时也属于计算机视觉中的一种任务。车型细类识别即通过从车辆图片或者视频中识别出车辆的具体型号。不同于传统的车
数据新闻是在大数据浪潮下衍生的一种新型报道方式,在计算机技术的支撑下,内容上用数据讲故事,形式上用可视化来呈现,通过对数据的采集、挖掘和分析这几个环节,挖掘数据背后
随着海运行业的不断发展,海上交通日趋频繁,做好海上安防、海洋环境监测、海上船只监测等工作以及开展相关研究的意义就尤为重要。目前国内外主要是基于合成孔径雷达(Synthet
得益于独特的物理属性和非接触、非侵占性,人脸识别技术已经成为了最重要的身份识别技术之一,在众多领域都得到了广泛的应用。在人脸识别算法中,如何提取高质量的人脸特征是
铝合金材料的室温疲劳性能的研究已经非常深入和广泛,对于低温环境下铝合金的疲劳变形行为的研究很少,对于低温条件下铝合金疲劳变形过程中合金的微观结构、变形机制等仍不清