论文部分内容阅读
互联网时代,在线内容和服务的爆炸式增长为用户提供了压倒性的选择,个性化推荐系统的研究是对实现信息过滤的重要突破,通常是根据用户的历史交互信息挖掘到潜在的兴趣偏好来推送令用户满意的项目。然而,基于协同过滤的推荐算法仅根据对用户项目交互信息的分析构建用户-项目评分矩阵来完成后续算法进行兴趣推荐,往往会存在着数据的稀疏性问题和冷启动问题。为了解决这些局限性,研究人员建议将辅助信息纳入推荐算法中,本文从语义方面出发,提出引入知识图谱丰富的语义信息,利用知识表示学习方法在保留用户或项目自身的语义信息的基础上,将数据嵌入低维的向量空间中计算语义相似度来产生推荐结果。该算法丰富了传统推荐算法中用户或项目的语义信息,有效的增强了推荐性能。本文研究内容如下:1.本论文引入伯努利抽样策略对知识表示中翻译模型训练过程的负采样算法进行改进,根据头实体与尾实体的不同关系类型分别设置不同的替代概率,减少构建错误负三元组的概率。2.本论文采用改进的翻译模型对用户与项目进行向量化表示和度量语义相似度,有效融合不同来源的信息和解决数据稀疏问题。提出基于翻译模型来学习准确表示用户与项目的语义信息,采用最大距离的思想将正负样本在向量空间中分隔开,意味着相近的实体聚集在相同区域空间,利用链路预测来验证模型的训练效率,选择欧氏距离度量实体间的语义相似度,距离越近相似度越高、反之越低;3.本论文提出基于知识图谱技术的推荐算法,主要思想为:根据分析用户与项目的交互数据,得到用户-项目评分矩阵,从互联网不同数据来源处抽取知识构建知识图谱,为矩阵中的项目找到知识图谱中的相匹配实体,用改进的TransH翻译模型学习和向量化表示知识图谱中实体的语义信息以及与不同实体间连接的关系信息,生成项目-项目的语义相似度矩阵。通过构建用户兴趣模型,可以动态的反映出用户兴趣随时间的变化,与用户-项目评分矩阵融合计算项目相似度的权重,结合权重计算得到最终的项目相似度矩阵,预测用户对项目的评分,按评分降序排列选取一定数量的项目作为推荐项目列表推送给用户。4.本论文使用电影领域、书籍领域、电子商务领域三个数据集进行实验验证该算法与传统的推荐算法在平均绝对误差、F1值方面相比较取得一定的提升效果。