论文部分内容阅读
推荐系统根据用户信息需求和个人兴趣,把感兴趣的信息推荐给使用者,是处理信息超载问题的有效方法。推荐算法是推荐系统的核心,是推荐结果的直接依据。本文主要研究基于知识图谱的推荐算法,使用深度学习方法对档案进行排序和推荐。本文主要工作是对档案领域推荐方法的研究和应用。根据甘肃省档案局提供的档案目录和档案文本数据,对其进行数据预处理以及构建档案知识图谱三元组;在Ripple Net模型上增加由知识图谱对应复杂网络的节点影响力,提出融合复杂网络和Ripple Net的Cn-RippleNet的模型;最后实现基于Cn-RippleNet的档案推荐方法。本文工作具体为以下几点:(1)构建档案知识三元组对档案领域本体进行基于七步法的构建,在此基础上对已有的档案目录以及档案数据进行处理,通过基于BERT的命名实体识别和关系抽取,从文本数据中得到档案的知识三元组。(2)基于复杂网络节点影响力的Cn-RippleNet模型研究针对Ripple Net模型,解决没有考虑限定域知识图谱中实体权重的问题。本方法在Ripple Net的基础上,结合复杂网络节点影响力,把知识图谱中三元组的实体对象抽象为节点,关系抽象为连边,计算出复杂网络中每个实体的节点影响力,并将其作为实体权重,放入Ripple Net网络中进行计算。(3)基于Cn-RippleNet档案推荐方法实现根据Cn-RippleNet模型的推荐方法设计对应档案推荐系统。该系统包含了用户数据处理模块、召回层模块、排序层模块,能够根据用户历史浏览记录,判断用户偏好,得到档案推荐列表。文中构建知识三元组实验使用甘肃省档案局提供的十万条档案目录数据以及部分低密级档案文本数据;文中基于Cn-RippleNet的模型研究所使用数据集为Movie Lens-1M和Book-Crossing,分别是在电影推荐和图书推荐的常用数据集。