面向API推荐的NLP库组合使用技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:nwwwdff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
应用程序编程接口(Application Programming Interface,简称API)在软件开发过程中起着重要作用,开发人员在软件开发、维护过程中借助API可以显著提高开发效率。API数量的急剧增长导致开发人员使用API的难度增加。API推荐技术帮助开发人员迅速找到需要的API。在API推荐技术中,研究人员需要分析各类包含自然语言的软件文档,从软件文档中提取API的功能描述、使用示例等信息,信息提取过程通常依赖于自然语言处理(Natural Language Processing,简称NLP)技术,因此,提升NLP库的分析能力能够优化API推荐技术对软件文档的应用,对API推荐技术的研究有着重要意义。为了更准确地分析软件文档,本文提出了一种面向API推荐的NLP库组合使用技术。本文的主要研究工作如下:(1)本文研究一种NLP库组合使用技术,利用不同NLP库的互补性来获得准确的结果,解决了推荐过程中NLP库的选择问题。NLP库组合使用技术包括两个主要步骤:文档级NLP库选取和语句级结果覆盖。首先,本文工作以自然语言处理结果的重叠度为度量指标,选取得分最高的NLP库为文档级NLP库;然后,逐句分析文档级NLP库的处理结果,将得分较低的语句级处理结果替换为其他NLP库中的最优结果,实现语句级的结果覆盖。本文将上述两个步骤相结合以实现不同NLP库的优势互补。(2)本文将NLP组合使用技术应用于API推荐场景中,设计并实现了面向API推荐的NLP库组合使用工具Com NT。该工具可对API推荐中的软件文档进行分词和词性标注,获得更准确的文本处理结果,优化API的特征标注,进而提高API推荐的准确度。(3)本文选取了4个热门的NLP库和200个软件文档构建实验数据集,用于评估NLP组合使用技术及其在API推荐场景中的应用效果。实验结果表明,NLP库组合使用技术在准确率方面优于单个NLP库,基于NLP组合使用的API推荐技术的推荐结果相比于传统API推荐技术具有更高的准确率。
其他文献
将触觉传感器获取的机器人、可穿戴设备、医疗器械等和外界交互产生的压力、温度等触觉信息以图像的形式表现出来可以形成触觉图像。而目前触觉传感阵列是获得这些触觉信息的主要途径。不同于视觉传感单元(如CCD/CMOS),触觉传感阵列的传感单元具有工作原理多样、尺寸大、读取电路复杂而难于集成等特点。为了提高触觉图像的分辨率,本文进行了基于传感阵列的触觉图像超分辨率算法研究。首先,研究了触觉图像特点;其次,分
城镇化发展过程中,违法用地、违章建筑等问题严重影响社会和谐与可持续发展,土地违法的“早发现、早查处”至关重要。针对以往人工巡查效率低、摄像头监控智能化程度低的现实问题,本文致力于研究违章建筑物自动识别中的监控点图像快速获取、违章建筑变化检测、车辆虚警过滤等关键技术。主要研究内容如下:(1)提出了一种基于金字塔L-K光流法的定点监控虚拟预置位设置方法。针对相机所带预置位不足的问题,首先对视频前后两帧
社会人口老龄化、全民运动化时代的到来,使得中老年骨质疏松性骨折创伤、感染、肿瘤、骨髓炎手术清创、以及中青年各种意外伤害和先天性疾病导致的骨缺损成为临床常见疾病,严重影响了国民身心健康。然而,自体损伤愈合范围有限,传统的针对骨缺损自体、异体骨移植的治疗手段,易产生致命的并发症,因此亟需研发设计成分、构型匹配特定骨缺损的功能型三维骨修复支架,为骨缺损部位提供桥接作用、引导骨的愈合修复。聚己内酯(PCL
在各类室内定位技术中,视觉SLAM具有自主性强、成本低、感知信息丰富等优势。目前,基于单类特征的视觉定位已有众多研究,但在室内弱纹理环境下,受限于对单类特征的高度依赖性,不同类特征间的互补信息未能有效利用、特征融合后的适应性与抗干扰能力不足。因此,融合特征间信息实现弱纹理环境下的高精度可靠定位,是室内视觉定位中亟待解决的问题。针对上述问题,本文提出了一种融合点面特征的视觉定位方法,该方法有效利用室
互联网应用的不断发展和完善正在推动企业项目从传统的单体架构向微服务架构转型,将集中式的系统按照业务特点垂直拆分成多个规模相对较小的独立服务,可有效降低系统的运维成本,提高版本迭代的开发效率,每个服务单独部署的方式也带来了灵活的集群规模调整方式,使得系统弹性扩容变的更加轻量级。伴随系统垂直拆分而来的还有各服务之间的网络通信需求,消息中间件就是一种为不同系统或同一系统内不同模块提供可靠的异步网络通信的
随着互联网技术不断发展,网络数据资源日益丰富,在给人们生活带来种种便利的同时也衍生了亟待解决的信息安全问题。身份认证是保护网络中用户数据资源的第一道关卡,现有身份管理系统存在着一些不足:(1)身份管理机制标准不统一,组织之间缺少强信任关系,不同应用服务之间不易融合;(2)身份管理依赖于第三方权威中心机构,身份信息易被泄漏、滥用;(3)用户数据访问控制机制不完善,用户对自身数据缺乏自主权,用户数据易
焊接是一项重要的加工技术,被广泛应用于各类生产制造领域。传统生产企业依赖手工焊接,焊接质量取决于工人的技术水平与工作状态,因此焊接效率与质量无法得到保障。相比于手工焊接,自动化焊接具有焊接效率高、焊接质量一致等特点。普及自动化焊接能够提高企业生产效率,保障产品质量并节省用工成本。焊缝跟踪技术是实现焊接控制的重要环节,也是焊接自动化与智能化的必要条件。本文通过对焊缝跟踪技术展开研究,设计并实现了一套
随着互联网技术的快速发展和大数据时代的全面到来,企业级应用中越来越多的应用场景需要在预定的时间点按照指定的时间规则去执行特定的任务,这样的任务就是“定时任务”。业务规模的发展和逻辑复杂度的上升使得定时任务在企业级应用中扮演着越来越重要的角色,但是现有的定时任务调度方案存在着可管理性差、并行处理能力差、任务编排能力差和可用性差等问题。针对以上问题,本文设计并实现了一个基于松耦合架构的分布式定时任务调
近年来,交通事故频发,为了保障出行安全,随着深度学习和计算机技术的发展,自动驾驶技术成为道路交通安全领域的研究热点之一。自动驾驶环境感知以及驾驶场景三维重建仿真对保障自动驾驶安全十分重要,本文围绕这两个任务,展开以下研究:首先构建了二维目标检测及(道路)语义分割融合模型(后简称融合模型)。融合模型包含3个子模块:特征提取模块(残差网络)、二维目标检测模块和(道路)语义分割模块。针对融合模型提出了“
随着计算机图形技术的快速发展,三维室内模型在室内设计行业得到了广泛应用,设计师只需在室内设计软件中简单地拖拽和替换三维室内模型就能高效地对室内空间进行设计和修改,大幅提高了设计效率,降低了设计成本。目前大多数室内设计软件都提供了大量的三维室内模型供用户挑选,然而用户在挑选模型的过程中通常只能使用有限的关键字以文本的形式进行检索,无法准确地获取到想要的模型,存在较大的局限性。因此,本文研究了一种基于