论文部分内容阅读
随着论文发表数量呈爆炸式的增长,怎样才能避免论文信息过载,同时为研究人员提供一个和其研究方向相关且有效准确的参考文献,成为一个很重要的问题。如何从海量的论文信息中挑选适合研究人员的参考文献,不仅很有意义,而且很有挑战。本文中,我们主要研究基于查询的论文参考文献个性化推荐。在该任务基础上,我们提出了两种重要的度量指标,一种是查询相关性,另一种是论文的影响力。前一种度量指标是从研究者的角度对查询词和论文的相关性进行度量,我们提出了一种统一的图模型方法来解决这个问题。这个图模型整合了多种不同类型的信息,包括论文,论文的内容,主题,作者,以及它们之间的关系。后一种度量指标主要是根据论文之间的引用关系和不同的时间影响来考察论文的影响力,并通过这种方式来找出对研究者重要的论文。上述两种度量指标对于参考文献的推荐都很重要。我们在ACL的数据集上做了一系列的实验,并达到了很好的效果。另外,在我们的算法中,实验结果证明查询相关性比论文的影响力更重要,基于查询的个性化推荐比非个性化推荐效果更显著。另一方面,时间依赖(time-dependent)的论文影响力比非时间依赖(time-independent)的论文影响力效果更好。