基于深度学习的相似软件项目检索系统的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:laohe5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展,开源已经成为软件产业的一种发展趋势。众多软件开发者为开源社区贡献了大量的软件资源和技术经验。丰富的软件资源固然为用户提供了便利,但由于其数量众多,更新迅速,不同资源间关联度大等特点,再加上现有的检索系统无法智能分析用户输入意图,导致检索结果僵化,用户快速地检索出相似的项目仍有一定困难。本文基于深度学习算法,提出一种相似软件项目检索系统的设计与实现。该系统使用 SpringMVC+Spring+MyBatis(SSM)框架,采用 Word2vec 预处理数据,运用神经网络模型如长短期记忆网络、卷积神经网络、Doc2vec模型深入分析用户的输入需求,解决检索结果不够智能准确的问题,帮助用户更加高效地找到自己想要的项目。本文主要对基于深度学习的相似软件项目检索系统的相关设计和实现进行描述,该系统功能模块划分为用户验证模块,搜索模块,搜索列表展示模块和项目详情模块。首先,概括系统的项目背景,分析了信息检索系统和深度学习算法的研究现状。接着介绍了系统所运用的架构技术SSM框架和深度学习算法的原理。然后,介绍本系统的需求设计、架构设计、模块设计和数据库设计。接着详细介绍LSTM,CNN和Doc2vec三种算法设计、模型设计、算法实现和评估结果,各模块详细设计与实现。最后,给出本系统系统测试情况。本文提出的三种算法设计的核心思想是将向量化后的用户输入用神经网络分类模型转化为基于项目类别的概率分布向量,基于分类结果进行聚类。这些向量形成软件项目类型空间,有利于运用距离公式计算向量相似度从而得到软件项目的相似度。本文实现的相似软件项目检索系统通过深度学习算法分析用户输入,增强了对用户查询意图的理解,也在一定程度上弥补了用户表达需求能力的不足。用户自由选择检索算法,针对检索结果给出自己的满意度,使系统和用户之间建立起一个平等相互的反馈机制。
其他文献
学位
学位
学位
现今,环境保护和人群健康问题已经成为全世界社会发展的重中之重,而近年来,中国工农业生产活动的快速发展严重影响了环境质量,我国环境污染事故也层出不穷,而环境治理手段相对匮乏且效果短暂。环境中的污染物,尤其是重金属,会在大气、水、土壤和食物中广泛分布,还会长期累积在机体中且不易降解。在此背景下,我国愈发重视农田土壤及典型农作物的重金属污染状况,国家领导人也多次强调了食品安全和人群健康的重大意义。目前,
南黄海陆架上发育了若干个大型水下沉积体系,分别有南黄海泥质区、古黄河水下三角洲、辐射沙脊群、扬子浅滩、长江水下三角洲,南黄海的独特地理位置使得该区域一直是海岸陆架区的研究热点,而南黄海沉积演化以及沉积物物源研究更是当前沉积学研究的热点。流体包裹体中保留了矿物成矿时期的环境条件,不同类型的流体包裹体反映出不同来源的流体信息。河流沉积物中的石英颗粒来自流域沿岸的各类岩石矿石的风化剥蚀产物,其中的流体包
学位
近来年,重金属引起的土壤污染和健康问题备受关注。土壤中重金属的来源主要包括人为输入和基岩风化残留这两部分。目前,已有大量研究对人为活动造成的土壤重金属污染进行了探讨,结果表明人为输入的重金属对农田土壤造成了显著污染。但对于具有地质高背景的基岩风化造成的土壤重金属污染,目前大部分研究主要集中在超基性岩地区。作为基性火山岩,玄武岩富含过渡族金属元素,其在表生环境中极易风化,因此是某些重金属元素重要的潜
学位
生态浮床具有生态协调性、经济性及适用性优势而被广泛应用于河道水体修复中,由于其主要依靠植物和微生物作用净化水体污染物,因此,受温度等环境因素影响较大,存在净水能力低下、处理效率不稳定等问题,在重污染水体中,浮床植物有时难以存活。因此,如何提高生态浮床氮磷去除能力,对其实际应用具有十分的重要意义。本文基于电化学反应稳定高效、便于维护的优势,将电解与生态浮床联用,选用生物质炭作为填料,构建了新型的电解
在大数据分析应用中,基于表模型的结构化大数据分析处理,仍然是目前众多行业最基本的需求。DataFrame是一种在编程语言环境中易于使用的表数据编程模型,它对数据分析统计过程有良好的抽象,因而得到了广泛的关注和使用。目前出现了 Pandas和Spark DataFrame等编程框架,但在编程处理能力上还存在诸多不足。为此,本文从编程模型和框架、算子并行化、性能优化、跨平台调度与计算四个层面,研究了