融合多维用户特征的文献推荐模型研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:holdingmanzsk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的到来,科技信息文献数量呈现爆炸式增长态势,科研人员很难快速地找到与之相关且高质量的文献。因此,本文从科研人员的多维用户特征出发,以异构信息网络和深度学习算法为背景,构建有效的文献推荐方案。本文分两阶段进行研究,首先分别基于异构信息网络和深度学习算法提出两种候选文献推荐集生成方法,然后选取多角度对候选文献集进行排序,最终实现高质量相关文献推荐方案。基于异构信息网络的候选文献推荐集生成方法,充分利用异构信息网络丰富的语义信息,选取用户的合作作者、作者单位、期刊和文献内容特征。首先基于文献、期刊、作者、关键词和作者单位五大实体构建文献信息网络;然后选择文献信息网络中的5条元路径并基于DPRel算法计算用户相似度矩阵,同时赋予各条元路径权重;最后5条元路径进行加权求和,得到最终的用户相似度矩阵,对目标用户实现相似用户集生成,并根据相似用户集发表文献生成候选文献推荐集。基于深度学习的候选文献推荐集生成方法,充分利用深度学习技术的健壮性特点,选取用户的合作作者特征、发表文献内容特征及参考文献内容特征。首先利用堆叠去噪自编码器实现用户合作作者信息提取,生成用户合作作者特征向量;然后利用融合注意力机制的双向长短时记忆网络实现文献基本信息提取,生成文献内容特征向量;最后在传统概率矩阵分解方法中,加入用户合作作者特征矩阵和文献内容特征矩阵,从而预测科研人员偏好,实现个性化候选文献推荐集。多角度出发实现候选文献集排序的方法中,使用作者的h指数作为作者研究级别的量化指标,同时考虑文献中所有作者位次赋予权重,各作者h指数加权求和得到文献最终的作者研究级别判别值AL;使用期刊影响因子作为文献的期刊研究级别判别值ML;使用文献被引次数和下载次数的比值作为“文献传播力”,并引入时间因素,得到文献的自身价值PL;最后,AL、ML、PL三者乘积得到文献的最终价值,实现候选文献集质量有效排序。实验选取中国知网(CNKI)数据作为实验数据集,通过Python和Matlab等实现模型验证。结果表明,基于异构信息网络的候选文献推荐集生成方法中多条元路径综合的推荐效果高于单条元路径,在F1值和推荐成功篇数比例上均有所提高;基于深度学习的候选文献推荐集生成方法较概率矩阵分解方法在RMSE值更低,推荐效果更好;文献集排序方法较传统排序方法在C值上有所降低,计算文献价值更加有效。
其他文献
目前,我国高科技领域集成电路(Integrated Circuit,IC,简称芯片)产业供应链陷入了被美国卡脖子的严峻局面,只有自主研发生产芯片才能够突破这个困局。作为产业供应链关键技术之一的集成电路设计软件工具,即电子设计自动化软件(Electronics Design Automation,EDA)的国产替代进程备受关注。EDA软件工具是集成电路产业的核心工业软件,EDA生态链的完整性与供应链
学位
网络购物的蓬勃发展不仅给人们的生活带来了便利,也造成了快递数量爆发式增长,同时也使末端配送成本高、效率低等问题逐渐暴露。自提柜一定程度上解决了快递配送末端存在的问题,但是由于智能快递柜行业在我国的发展处于上升阶段,各方管理机制尚未完善,这使得自提柜行业中存在着许多问题,如收费标准和保存时间不合理、取件方式容易造成隐私的泄露并带来严重后果、在使用途中遇到故障难以得到快速、有效的解决方案等。这些使得消
学位
近年来太阳能驱动的界面蒸发技术因其零能耗、绿色环保、低成本等优势成为极具潜力的海水淡化和污水净化方法之一。目前,制约该技术商业化的因素主要包括:蒸发性能低、寿命短、成本高等,而传统光热材料(如贵金属、碳纳米管等)存在的水运输通道不理想、光热转换效率低等缺点是影响蒸发性能的关键。二维(2D)Ti3C2TxMXene因具有独特的层状结构、优异的光热转换性能、对重金属离子选择性吸附等特点在水处理方面得到
学位
随着人们可支配收入的提高,人们对食品尤其是生鲜产品的质量以及安全的要求越来越高,冷链作为保证生鲜产品质量的重要手段,其发展一直备受重视,政府已经出台了一系列措施推进产地预冷的发展。我国冷链运输及配送阶段已经逐步完善,而产地预冷直到在《关于加快推进冷链物流运输高质量发展的实施意见》颁布后才得到关注,产地预冷不仅能减少食物浪费、扩大产品的销售范围并延长销售时间,还能稳定农产品价格,完善我国的冷链体系。
学位
学位
公路货运是物流运输中占据主导地位的运输方法,公路运输的方便灵活可以使得货物实现点对点的运输,公路运输中承运方主体种类繁多,其中个体户、物流专线公司占据较大比重。我国公路货运中长期存在信息闭塞,车货双方较难沟通,空载率较高等问题,这极大的影响了物流领域的效率。随着物流信息化和互联网技术的发展,出现了大量的物流信息平台,这些平台将货物与车辆的信息进行整合,呈现给用户供其选择,虽然平台拥有大量信息,但是
学位
健康数据对提升公众健康水平的巨大潜在价值与可利用的健康数据很少的矛盾激发了健康数据交易平台的诞生,健康数据交易平台在运营过程中首先面临的问题是如何激励大众共享数据,通过货币激励的方式收集健康数据后,平台会考虑为数据需求方提供数据,数据需求方通过数据分析提供服务给公众,进而提升公众健康水平。现实生活中公众对隐私的重视程度不同,他们会共享不同隐私级别的数据。且存在不同类型的数据需求方,他们因使用数据的
学位
随着电商的飞速发展,快递服务在人们生活中占有愈来愈重要的地位,快递消费者的需求开始由基本服务向高级精细化服务过渡,快递服务水平逐渐成为快递行业提高竞争力的重要影响因素。目前对快递服务质量的研究中收集顾客意见主要通过问卷的方式进行,此方式具有主观性和片面性。本文基于快递在线评论语料,利用情感分析的方法深入研究快递服务质量评价体系,提出了影响快递服务质量的主要因素,为快递用户对于快递公司的选择提供参考
学位
如果将图G的顶点集V(G)分成k对两两不交的子集V(G)=∪i=1k Vi,使得每个子集Vi都能诱导出一个q-退化的子图,称这样的划分为图G的一个q-退化k-可染(划分).如果图G的q-退化k-染色,对于任意的1 ≤ i<j ≤ k都满足||Vi|-|Vj||≤1,我们称这样的划分是均匀的.图的均匀划分可以基于一些基本原则将大型复杂网络划分为一些小的子模块进行建模,这种划分在网络科学和信息科学中有
学位
随着国家管控力度的加强和消费者环保意识的提高,许多企业开始重视绿色产品的创新、设计与生产。由于供应链“绿色化”会带来需求和成本的变化,供应链的权力结构以及成员的行为因素会显著影响决策、收益和效用,甚至影响企业间的长期合作。因此,针对差异化绿色产品,进行多情景下两期绿色供应链的决策研究是十分必要的。本文首先考虑了决策者具有一种行为因素(跟随者公平关切、领导者利他偏好)的情形。针对开发密集型绿色产品(
学位