基于源代码和用户评论的代码质量分析方法研究与实现

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:leneyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,针对代码质量研究十分重要。基于源代码的代码质量分析技术一般借助于静态分析或动态测试方法对源代码进行度量,具有简单、易实现的优点,有助于代码质量的分析。随着开发者社区和代码托管平台成为程序员获取代码的主要途径,针对代码的用户评论数量急剧增加。用户在使用代码后给出的评论中包含多种代码质量信息,基于用户评论的代码质量分析可以站在用户角度进行代码质量分析,从而帮助开发者在了解用户的代码使用情况和用户关注的代码质量后有针对性地提升代码质量。然而,在当前针对代码质量的相关研究中,研究人员或是以源代码作为代码质量分析的数据来源,或是以与源代码密切相关的非源码信息作为研究对象,仅针对一个或少数几个方面的代码质量进行分析,对于多个方面的代码质量分析和综合考虑源代码和用户评论中的代码质量研究则较少。此外,针对代码的用户评论多为复杂句,且复杂句中包含了多种逻辑关系,导致判断用户评论中的代码质量信息困难。因此,如何针对源代码与用户评论中的代码质量信息进行研究,从源代码和用户评论两个方面对代码质量进行综合分析是本文工作的重点。本文基于源代码和用户评论两个方面对代码质量分析展开研究,论文主要工作如下:(1)定义了基于源代码和用户评论的代码质量模型。结合软件质量模型,给出了代码质量的层次表示和基于源代码和用户评论的代码质量模型结构。此外,针对代码质量,划分出了11个代码质量属性及子属性,并针对11个代码质量属性构建了相应的代码质量属性特征词库。(2)针对源代码中的代码质量信息,提出了一种基于源代码的代码质量分析方法。该方法包括分析源代码中的代码质量信息及结合基于源代码和用户评论的代码质量模型结构获取源代码中的代码质量。(3)针对源代码的用户评论中的代码质量信息,提出了一种基于用户评论的代码质量分析方法。该方法包括分析用户评论中的代码质量信息及结合基于源代码和用户评论的代码质量模型结构获取用户评论中的代码质量。其中,在分析用户评论中的代码质量信息时,提出了一种可适用于复杂用户评论的代码质量信息识别与分析方法,该方法包括构建用户评论的依存句法关系有向图、基于依存句法关系的主题判断规则抽取用户评论中的主题、主题对应代码质量属性识别、基于主题处理规则进行相同主题的合并与不同主题的处理。然后,再对分析的代码质量信息判断其情感倾向,并结合代码质量模型结构获取用户评论中的代码质量。(4)针对源代码和用户评论中的代码质量信息,提出了一种基于源代码和用户评论的代码质量分析方法。结合基于源代码的代码质量有向图和基于用户评论的代码质量有向图,提出了相互补充和相互验证两种分析规则对源代码和用户评论中的代码质量进行综合分析。(5)根据提出的基于源代码和用户评论的代码质量分析方法,开发了一个系统原型。通过基于源代码和用户评论的代码质量综合分析的实验,证明了本文方法的有效性。
其他文献
金属作为制造业的支柱产品之一,金属的质量优劣影响着终端产品的质量。金属表面缺陷检测是金属质量控制的重要一环。金属的表面缺陷检测中,基于机器视觉的检测技术已经成为主流。机器视觉本质上是模仿人类视觉系统,现在表面缺陷系统中硬件设备已经较为成熟,因而图像处理技术成为研究重点,其性能决定着整个缺陷检测系统的性能。金属表面缺陷图像存在着,缺陷和背景对比度低,缺陷类型和尺寸差别大等问题,同时还存在高光和阴影干
汽车作为一种大众消费品早已进入千家万户,伴随着数量增加,安全驾驶的问题也变得越来越显著,其中危险驾驶行为给驾驶员和乘客都带来了极大的潜在危险和财产损失,由于危险驾驶行为具备隐蔽性和无意识性,需要借助辅助设备进行疲劳驾驶检测,故本文提出了综合多因素的驾驶行为评判标准,在一个网络框架下实现了多任务的融合,实时准确且便于移植,该系统的应用对于驾驶员的安全驾驶,智慧城市的推进都具有重要意义。现阶段的危险驾
肺癌是目前所有疾病中对人类威胁最大,却极难治愈的肿瘤疾病之一。及早发现和尽快治疗是当下仅存的防治肺癌最奏效的措施,肺癌在发病初期主要的表现形式是肺结节,医生可以通过对胸部CT的观察和分析对早期肺癌进行及时诊疗。然而,随着肺部CT图片数量的激增,单纯依靠人工从大量CT图片中进行筛查、判断几乎是不可能的。基于深度学习的计算机辅助系统能够对CT图片进行初步的选取处理,可以大大减轻医生负担,降低医生误诊、
阿尔茨海默病(Alzheimer Disease,AD)以及注意力缺陷障碍症(Attention Deficit Hyperactivity Disorder,ADHD)等神经性疾病深深的影响着每一位患者的健康,该类神经性疾病起病比较迟缓,不容易被诊断出来,如果能够在早期及时的发现,则能够在很大程度上降低该类疾病晚期的发病率。人脑磁共振(Magnetic Resonance,MR)图像中的解剖结构
从时空数据中挖掘模式在人类出行行为、智能交通、城市规划和生态研究等方面有着重要的应用。信息化城市建设的一个重要问题是如何从海量的轨迹数据中挖掘出频繁轨迹序列模式进行定位感知和基于位置的服务(location-based services,LBS)。传统的轨迹序列模式挖掘算法由于挖掘过程中会产生大量中间子序列,严重影响算法收敛速度和挖掘效率。另外,随着定位技术的飞速发展,时空数据的获取越来越广泛,数
老挝作为中国的重要邻国,与中国在经济上有着密切的联系,开展老挝自然语言处理的研究工作存在重要战略意义。其中,机器翻译、信息检索等跨语言信息处理任务需要汉老双语平行语料的支持。双语句子对齐作为构建双语平行语料的关键技术,旨在提取双语文本中语义相同的平行句子对,因此具有重要的研究意义。本文提出一种融合多特征的汉老双语句子对齐方法,从而解决研究中存在的问题,主要工作如下:(1)融合文本特征的汉老双语句子
汉语-老挝语文本相似度计算研究对开展老挝语的自然语言处理研究和中老交流与发展具有重大意义。老挝语属资源稀缺型语言,汉语和老挝语具有相似的句子结构特征,通过在模型中融入语言特征能在有限的训练数据中获取更多的语义信息来提高相似度计算模型的性能。为了获取更准确的双语文本语义表示,按篇章文本的构成将其分为了段落短文本和句子,通过研究不同粒度下的语义表示方法,获取高质量的句子语义表示、段落短文本语义表示,最
引言2021年7月24号,"双减"政策出台。"双减"的任务之一就是要减轻学生不合理的作业负担。而教师作为作业布置的主体,应重视作业的设计。本文就初中英语作业设计中存在的问题,结合课例阐释如何在课程视域下提高作业设计的质量,以便更好地发挥作业的积极作用,落实"双减"政策。
期刊
着装场景下的人体姿态估计能有效提高虚拟试穿的真实性和动感展示,因此,准确估计出着装图像中的人体姿态,对辅助二维虚拟试穿具有重要作用。本文针对时尚着装场景中由于服装款式多样、背景干扰、着装姿态多变等因素,导致着装人体姿态估计精度较低的问题,以时尚街拍图像为例,首先,通过爬取大型时尚街拍图像网站Chictopia,并结合在线图像搜集获得数据集原始图像,使用Label Me对图像进行精细的人体信息标注,
太阳日冕结构的密度、位置和形状短至几秒钟就会发生变化,较大的动态范围,造成望远镜拍摄的日冕结构边缘模糊且噪声较大,使得可视化困难。随着数字图像处理技术的发展,盲退卷积算法对于要求恢复结构准确性和真实性方面提供了科学的理论依据。图像退卷积算法是图像复原增强领域的一个经典问题,因为方程的求解是欠定的,所以在退化模型的构建,清晰图像和模糊核的先验信息,失真效果的抑制,迭代算法的稳定与准确方面,越来越多的