【摘 要】
:
随着移动互联网的快速发展,伴随着的是用户需求的快速增长,为解决用户海量的需求,开发者需要开发出大量的应用。理解已有程序代码是许多软件开发任务的基本步骤,如何才能快速地分析出代码所实现的功能,并尽可能地压缩程序开发和维护流程,已经成为软件工程领域的热点问题,具有十分重要的现实意义和经济意义。传统的程序分类任务只能依赖大量的人力进行人工标注,效率低下。有学者从自然语言处理领域借鉴经验,将深度学习引入到
论文部分内容阅读
随着移动互联网的快速发展,伴随着的是用户需求的快速增长,为解决用户海量的需求,开发者需要开发出大量的应用。理解已有程序代码是许多软件开发任务的基本步骤,如何才能快速地分析出代码所实现的功能,并尽可能地压缩程序开发和维护流程,已经成为软件工程领域的热点问题,具有十分重要的现实意义和经济意义。传统的程序分类任务只能依赖大量的人力进行人工标注,效率低下。有学者从自然语言处理领域借鉴经验,将深度学习引入到程序语言处理领域,提升程序代码的理解速度。此前的研究使用的是传统卷积神经网络或者循环神经网络作为分类模型,但由于程序具有较强的局部语义结构特征和长期依赖,导致这种简单移植的策略效果并不理想。又有学者提出使用基于抽象语法树的向量表示来表征代码,通过抽象语法树来保留代码中的局部语义结构特征,这种方式取得了一定的进展。本文在以往研究的基础之上,提出了一种基于ConvTransformer的程序代码分类研究模型,通过在词嵌入中添加位置信息,使用Transformer的注意力机制来捕获程序代码的局部语义结构特征和长期依赖,模型通过位置编码来学习到代码词的位置关系。本文在程序语言类别分类实验和程序功能类别分类实验中进行多种模型的对比。在程序语言类别分类实验的分类准确率达到97.5%,在程序功能类别分类实验中准确率达到85.6%,证明了该模型具有一定的有效性和先进性。
其他文献
随着自动驾驶的研究逐步走向实用化,人们对自动驾驶准确性与安全性的要求也越来越高。自动驾驶系统是一个高度自治的系统,包括感知模块,路径规划模块,行为决策模块和自适应控制模块,其中行为决策模块是确定自动驾驶汽车安全性和稳定性的关键技术。现有的主要决策算法可以分为三类:基于规则的方法,强化学习方法和深度学习方法。基于规则的方法对于简单场景的准确性很高,但是规则制定方法的复杂性限制了它在复杂环境中的进一步
根据中国癌症中心发布的报告,脑癌是发病率第二高的儿童癌症,也是15-34岁成年人癌症死亡的第三常见原因。脑癌的治愈率并没有随着科技的进步而提升,只有及时发现并及早治疗才能有效提升患者的治愈率与存活时间。随着医疗影像技术的进步和推广,核磁共振技术(MRI)成为了脑癌的主要诊断方法,该技术可以帮助医生在不通过外科手术的情况下诊断出脑癌。但医疗影像的判读需要医生拥有丰富的临床经验,同时筛查细节较多的脑部
远监督关系抽取任务通过将知识库中的关系事实与语料库对齐自动产生训练数据,有效地减少了手工标记数据的成本,并且被广泛地应用在大型语料库中以查找新的关系事实。然而该方法在自动生成训练数据的同时却不可避免地引进了大量的噪声数据,这对于模型的训练很不利。在这里我们利用互信息分别从句子级和单词级进行降噪,以解决此问题。我们的方法均是通过有效句子间的互信息实现,而该信息的获取主要基于“有效句子间是存在联系的,
多细胞生物依赖多种分化的细胞密切合作,共同完成复杂的生命活动。通过对单个细胞和细胞间的相互作用分析来揭示生物体内的活动,可以达到对细胞间差异的发现和对疾病进行精准治疗的目标。在对细胞中蕴含的信息进行研究时,会采用不同的技术进行研究与分析。随着单细胞研究投入的增加,单细胞相关技术大量涌现,积累了大量相关数据。然而,研究者们难以从海量的数据中获得有效的信息,提出快速高效的机器学习算法对单细胞相关技术的
人体姿态估计作为行为分析以及动作识别的重要技术,在计算机视觉中具有非常广阔的应用前景。近年来,虽然深度学习在一定程度上极大地促进了人体姿态估计相关工作的进步,但如何将人体模型更好的融合到卷积神经网络中,如何在保证高精度的同时提高网络的处理速度,如何对人体姿态的先验知识实现更充分的利用仍然具有特别重要的研究意义。因此本文以基于深度学习的姿态估计算法为主要研究内容,旨在设计出一种更高效,更准确的姿态估
在数字化正畸治疗过程中,对锥形束CT(Cone Beam Computed Tomography,简称CBCT)图像检测出单个牙齿的位置和牙号是帮助了解正畸治疗的有效手段,也是下一步进行单个牙齿分割的必要前提。近些年随着深度学习算法的蓬勃发展,基于卷积神经网络(CNN)的目标检测算法在医学图像领域的应用热度也逐渐高涨。但CBCT不同于自然图像,既包括CT和图片在自身维度和数据格式上的差别,例如:C
由于全球能源的短缺以及地球环境的不断恶化,近年来,汽车行业向新能源方向飞速转型发展。而燃料电池在工作的时候仅氢气与空气反应,产物仅为水,具有节能环保、安全高效等特点,且其相较其余新能源车型具有续驶里程长、燃料加注时间短等优点,必将成为今后新能源汽车的发展趋势。本文中,燃料电池汽车采用质子交换膜燃料电池(PEMFC)与锂电池组合的方式,PEMFC提供主要电能,锂电池组辅助提供电能,单独或协同工作,为
油田开采过程中涉及的项目种类比较多,因此需要应用大量的生产设备,同时还要涉及油田开采过程中需要的原材料、产品等,一些产品和原材料具有易燃易爆、有毒有害等特点,所以我们要高度的重视油田采油现场的安全管理工作。本文主要阐述了采油现场常见的危险源,对采油作业现场常见的安全隐患分析,根据实际情况制定采油作业现场的危险预防与控制措施。
在计算机视觉的基本任务中,目标检测毫无疑问是应用最广泛的算法。在完成目标识别任务的基础上,目标检测任务还要将不同类别的目标用不同颜色的矩形边界框表示出来。最近,基于深度学习的目标检测算法向人们展示了非常强大的能力。这些方法通常假定有大量标记的训练数据可用,并且训练和测试数据来自相同的分布。然而,这两个假设在实践中并不总是成立的。在现实中,训练集和测试集的数据往往存在很大的不同。这将会导致检测准确率
猪作为一种可以大规模养殖的动物,在动物养殖领域占有极其重要的地位。当今社会的飞速发展使得日常生活水平显著改善,猪肉供给量的增加导致猪只养殖基地不断扩充,然而如何有效安全的对养殖基地进行集约化管理成为当前所面临的首要问题。猪肉在我国肉制品消费的种类中占有很重要的地位,但是猪瘟疫情时有发生,为了保证食品安全,防止问题猪肉流入市场,对猪肉源头进行有效监管的需求日益迫切。除此之外,随着人们防范意识的不断增