【摘 要】
:
随着互联网的高速发展和广泛普及,社会上各个领域的科研水平都在不断提高。科学技术迅猛发展,而科技文献就是其中的重要产物。在这个过程中,科技文献的数量在与日俱增。如何从庞大的文献资料库中获取到学者们所需的文献,是目前相关研究者急需解决的一个问题。面对这样一个问题,推荐系统应运而生,并成为大数据时代不可或缺的组成部分。近年来,引文推荐在学术领域受到越来越多的科研人员关注,成为学术领域和商业领域的研究热点
论文部分内容阅读
随着互联网的高速发展和广泛普及,社会上各个领域的科研水平都在不断提高。科学技术迅猛发展,而科技文献就是其中的重要产物。在这个过程中,科技文献的数量在与日俱增。如何从庞大的文献资料库中获取到学者们所需的文献,是目前相关研究者急需解决的一个问题。面对这样一个问题,推荐系统应运而生,并成为大数据时代不可或缺的组成部分。近年来,引文推荐在学术领域受到越来越多的科研人员关注,成为学术领域和商业领域的研究热点。目前引文推荐的相关方法考虑引文的特征单一,大多是从某个属性或指标进行分析,而现实中引文关系错综复杂,单一辨识指标或属性的评价容易存在偏差,缺乏对引文进行整体性的分析考虑。因此,综合考虑维度成为学者研究引文推荐的一个思路。本文针对引文推荐展开了相关的研究工作,提出了多维度融合的引文推荐算法。主要的研究工作如下:1.本文基于文献被引用关系网络图,对文献差异性、时间性和高质量新文献低被引3个问题进行了考量,并提出New-PR算法对文献进行重要性分析。实验结果表明,New-PR算法所推荐的文献,在发表时间和未来被引用量两个评价指标上的表现,显然优于原始算法的推荐结果。2.本文运用特征词、模式识别的方法对描述创新点的句子进行准确定位,并基于候选句子和关键短语,建立科技文献创新度的评价模型。实验结果表明,本文提出的科技文献创新度评价模型在文献评价与推荐中,具有合理性和有效性。3.本文基于重启随机游走算法和word2vec模型,对原始算法的概率转移矩阵进行改进和优化,以更适应于文献相关性的分析和计算。实验结果表明,改进后的算法,在召回率和NDCG指标的表现上,都要优于原始算法。本文提出一种有效结合文献重要性维度、文献创新性维度、文献活跃度、作者维度及文献相关性维度的多维度融合算法。实验结果表明,5个维度对引文推荐都存在积极影响,且本文提出的多维度融合的引文推荐算法较其它算法而言,因对多个维度进行了考虑,使得候选文献集有一个更加合理的Score值,最终的推荐效果也更为理想。
其他文献
随着线上信息数据的大量增长,“信息过载”成为不可忽略的问题,推荐系统是克服此问题有效的手段之一。其中,用户与商品间关系的建模在推荐系统中扮演着重要的角色。但现存的方法中,大多数模型是采用了一种线性的方式对此建模,这可能会限制模型的性能。尽管最近的一些工作已经运用深度学习技术去捕捉用户与商品间的非线性关系。但当神经网络被使用时,这里仍存在两个潜在的问题。第一个问题是随着神经网络层数的增加,整体算法的
圆周SAR(Circular SAR)是能全天时全天候工作的一种新兴成像雷达,其雷达随着载体在某一高度做圆周运动,天线波束中心始终指向成像区域中心。在这种运动模型下,雷达能够全方位的获得目标的反射信息,使得方位向的频谱信息扩展到最宽,不仅获得了更多目标信息,也大大提升了方位向的分辨率,有着传统直线SAR无法比拟的优势。现有的圆周SAR成像算法中,时域的后向投影算法(Back Projection,
背景:重症肌无力(myasthenia gravis,MG)是一种自身免疫性疾病,由针对神经肌肉接头突触后膜蛋白的自身抗体导致神经肌肉接头传递障碍。重症肌无力在发病年龄、受累肌群、病程
随着信息时代的飞速发展和用户数据量的快速增长,数据库的性能变得越来越重要。主存哈希连接算法作为数据库连接操作的一种实现,具有速度快、应用范围广的特点,一直受到国内外学者的普遍关注。根据哈希连接算法是否针对硬件架构特性进行优化可以将其分为两大类型,分别是硬件非敏感哈希连接算法和硬件敏感哈希连接算法。新一代众核处理器Knights Landing Processor(KNL)具有与多核处理器不一样的架
自由空间光(Free-Space Optical FSO,)通信,又称无线光通信,是一种具有通信频带宽、保密性强、容量大及功耗低等多种优点的新兴通信方式,在目前的通信领域中受到了极为广泛的关注。准循环LDPC(Quasi-Cyclic LDPC,QC-LDPC)码作为一种实用性极强的码,其校验矩阵拥有准循环特性,能够在降低构造复杂度的同时获得优异的码性能。将比特交织迭代译码编码调制(Bit-Int
目的:探讨circEPSTI1在胃癌组织和细胞中的表达及功能,并分析其在胃癌中的临床意义。方法:采用qRT-PCR法检测circEPSTI1在胃癌组织与非癌胃粘膜组织以及不同胃癌细胞与正常胃
在大数据时代,越来越多的视频数据等待着被处理、分析和挖掘。然而,很多视频在产生时并没有进行有效的标注甚至没有标注,这给人们搜索并处理他们感兴趣的视频部分带来了极大
基于地理位置的社交网络随着互联网技术的发展而逐渐被人们所接受,其提供了发布即时消息、与他人分享定位等功能,形成了更加具有现场感的线上社交圈。庞大的用户量和互动信息为海量数据的提取和挖掘奠定了基础,因此吸引了不少学者的关注。但这不仅是给业界学者的研究提供了一个良好契机,同时更是带来了大数据时代背景下的一个具有现实意义的挑战。其中,兴趣点推荐算法以其应用的广泛性和使用的便捷性,在基于地理位置的社交网络
预测控制作为一种新型计算机控制算法,近年来得到快速发展,在工业控制中以模型精度要求低、计算方式简单、控制品质优良的特点,取得了十分成功的应用。但是由于工业过程对象的非线性模型难以建立以及控制要求不断提高,基于单模型的预测控制算法已经难以满足时变,大时滞系统的控制要求。因此,对于多模型预测控制的研究可以有效地拓宽预测控制在工业控制领域中的适用范围,提高其对复杂工业过程的控制品质。本文从预测控制的产生
近年来,智能照相设备的普及带来图像数量的激增,如何从海量图像中快速准确地查询到用户感兴趣的内容,已成为多媒体信息检索领域的一大研究热点。基于内容的图片检索,允许用户