【摘 要】
:
我们提出了一种能够对源代码块自动生成功能描述性注释的框架。在此之前这一问题已经被很多研究人员进行过了研究,不过他们的方法大多数都是基于固定模板和规则进行注释生成,
论文部分内容阅读
我们提出了一种能够对源代码块自动生成功能描述性注释的框架。在此之前这一问题已经被很多研究人员进行过了研究,不过他们的方法大多数都是基于固定模板和规则进行注释生成,或者将源代码当作普通的自然语言使用LSTM等模型进行处理,效果并不显著。我们的框架不依赖于任何模板,同时使用了基于源代码解析树结构的递归神经网络来对源代码进行特征提取工作,这是因为源代码的解析树结构当中同时包含了源代码的语义信息与结构信息。模型会将这些特征嵌入到一个向量当中进行表示。我们把新的递归神经网络叫作Code-RNN。然后我们把通过Code-RNN得到的源代码特征表示向量输入到一种叫作Code-GRU的新型循环神经网络当中进行注释生成。在Code-GRU当中我们增加了一个叫作选择门的新结构来对特征向量进行处理,以能够从特征向量当中获取足够的信息生成注释。我们选择使用ROUGE-2数值作为衡量注释生成好坏的标准,整个框架生成的文本描述性注释效果显著高于其他基于学习的方法比如Sequence-to-Sequence等模型。我们的Code-RNN模型同样能够用于其他需要对源代码进行特征提取的场景当中,仅需要重新生成对应程序语言的解析树即可。
其他文献
沪港通是上海证券交易所和香港联合交易所允许两地的投资人,通过当地证券公司或者经纪商,买卖对方交易所的标的股票,是一项互联互通机制。沪港通于2014年11月17日启动,沪港通
互联网时代的到来,意味着互联网不仅仅是一种提高学习科研效率的工具,而是一种对社会形态全面的改变。互联网诞生于高校科研空间中,现在反过来推动了高校科研的发展,引领了创
寒区工程的勘察、设计与建设等过程须掌握冻土蠕变特性。其研究能准确预测冻土长期蠕变变形和强度衰减规律,用于有效地减少蠕变所带来的工程灾害。球形压痕试验有其他静力强
驯化是生物在长期的自然选择和协同进化过程中,物种间演化出的一种互利共赢的生存方式,是将自然环境下的动物或植物繁育改变为人工控制下的过程。马的驯化是一个复杂有趣的过
近年来,H5N6已逐渐取代H5N1成为我国主要流行的H5亚型高致病性禽流感病毒(avian influenza virus,AIV),且随着病毒的不断进化其基因组构成日趋复杂,部分流行株的6个内部基因
高光谱图像解混是识别高光谱图像中的地物成分以及估计地物丰度的一类重要技术。由于高光谱传感器对地物观测的空间分辨率有限,传感器只能获得不同地物反射的混合光谱图像,难
本文以应用于超声速燃烧室的凹腔上游喷注气体燃料的贫燃燃烧为研究对象,采用数值仿真和实验相结合的手段,研究了超声速气流中凹腔稳定火焰的贫燃近吹熄特性和火焰吹熄的动态
我国大多数企业和单位都离不开财务行为,企业和单位内部的财务信息也处于实时更新或波动的状态,为了帮助企业和单位管理者及时掌握财务变化情况,实现财务信息的高效管理。但
在当今这个各方面飞速发展的时代,环境污染和能源短缺等现象愈演愈烈。风能作为绿色且可再生能源,对其进行深入高效地利用研究显得至关重要。对此,世界各国以高度重视的态度
人体姿态估计是指对图像和视频中的人体骨骼关键点进行检测,从而确定人体姿态的过程,是计算机视觉的重要研究方向。准确的人体姿态估计是理解图像和视频中人物行为的关键步骤