【摘 要】
:
大规模开源代码社区为开发者提供了丰富的软件资产,但要理解和利用这些代码却十分耗时耗力。为寻求代码理解、分析和挖掘的语义支撑,针对源代码变量名进行了研究,提出了一种
【机 构】
:
上海交通大学软件学院,公安部第三研究所
【基金项目】
:
国家自然科学基金资助项目(61472242);信息网络安全公安部重点实验室开放课题资助项目(C14609)
论文部分内容阅读
大规模开源代码社区为开发者提供了丰富的软件资产,但要理解和利用这些代码却十分耗时耗力。为寻求代码理解、分析和挖掘的语义支撑,针对源代码变量名进行了研究,提出了一种基于字段相似度与语义关联度的自动语义标注方法,并实现了相应的工具。该方法首先建立英文、中文、拼音语料库,并构建字段相似度模型生成多种候选标注方案;然后利用马尔可夫转移矩阵和语义网Word Net构建概率模型评选出最优的标注方案,从而实现源代码变量名的自动语义识别。使用Git Hub开源项目代码进行标注准确度实验,结果表明,初次标注准确度达到68.1%,随着用户反馈增加逐步提升到73.3%。
其他文献
近年来,伴随着我国社会经济的持续发展,市场竞争也越来越激烈,物资采购是企业生产经营最基础的环节,会对企业的持续发展带来直接影响。对国有企业而言,由于其生产规模大,物资
0 引言PSS(电力系统稳定器)于1968年诞生于美国.1990年该国发布的标准IEEE Std.421.2中,要求每台并网运行的发电机组都必须在其励磁控制系统中配置PSS,并推荐了该国广为采用
渭南师范学院从"青年马克思主义者培养工程"实践中探索的大学生马克思主义素养培育模式——"四三三六"模式既从国际高校德育实践中得到启示,又得益于国内高校德育实践的滋养,
5月的北京繁花似锦,而南半球的拉美却临近凄冷的冬天.2月份我们曾提示,美国债市利率的调整更值得关注.近期,美国10年期国债利率已突破3%,创下自2011年5月以来7年的新高.与此