基于知识图谱的个性化推荐技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jsnjwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今互联网高速发展与信息爆炸增长的时代下,人们容易出现信息过载等问题,难以获取有效信息并学得知识。为了解决信息过载的问题,个性化推荐系统应运而生。相比搜索引擎,个性化推荐系统更适用于用户需求不明确或无法准确用关键词描述的应用场景,例如我们常见的新闻资讯类、电商类、音乐类等应用。在实际应用中,大多数推荐系统一般采用协同过滤推荐算法,仅输入用户交互数据,存在着稀疏性问题与冷启动问题,在一定程度上限制了推荐效果。从根源上讲,数据的不完善是导致数据稀缺和冷启动问题的根本原因,因此本文引入知识图谱作为辅助信息,重点研究了知识图谱的分布式表示方法、基于知识图谱的个性化推荐算法。本文的主要研究内容如下:首先,对于知识图谱的分布式表示方法,本文介绍了现有图分布式表示方法损失了子图级别高阶相似性的问题。为此,本文提出了一种基于循环神经网络的知识图谱分布式表示模型KG-GRU,利用包含节点与关系的序列,对子图相似性进行建模,将关系与节点表示在相同的嵌入向量空间。此外,本文提出跳转或停留策略JUST,指导随机游走对知识图谱进行数据采样,避免了手动构建元路径以及节点类型分布不平衡的问题。然后,本文提出了两种基于知识图谱的个性化推荐算法:KG-CF和KG-GRU4Rec。基于融合内容的协同过滤算法思想,KG-CF直接将领域知识图谱中物品的分布式表示向量融合进物品相似度计算,即向传统的基于物品的协同过滤算法补充了物品的语义信息,从而提高个性化推荐效果。KG-GRU4Rec改进于本文提出的知识图谱分布式表示模型KG-GRU,实现了一个端到端预测用户评分的模型,避免了KG-CF的评分预测依然依赖用户历史评分数据的问题。最后,在实验阶段,本文以电影推荐为应用场景,选择了个性化推荐领域广泛应用的Movie Lens电影推荐数据集。为评估本文提出的上述算法模型,本文调研并实现了电影领域知识图谱的构建,包括从电影领域本体库的构建,电影相关数据爬取,到知识的抽取与存储。最后,本文通过链接预测实验证明了KG-GRU模型能够学习本文构建的电影领域图谱中实体与关系较为准确的分布式表示,通过Top-N电影推荐实验证明了KG-CF和KG-GRU4Rec推荐算法在命中率和平均倒数排名方面优于对比算法。
其他文献
政治思想教学至关重要,作为政治课教学老师,不仅要有理论知识和教学经验,自身还应具备高尚的思想政治素质及授课技巧引发学生学习兴趣,提高教学效果。
作为一所学前教育专业为重点学科的专科院校的教学中层管理者,作者试图通过本文,针对专科院校学前教育专业人才培养传统模式改革提出观点。本文基于OBE教育理念,分析了学前教
目的了解县级基层医院维持性血液透析(MHD)患者的基本情况及并发症,并对并发症进行分析,为降低透析并发症发生率、提高患者生活质量提供帮助。方法针对宿松县人民医院和宿松县中
托尔斯泰的长篇小说《复活》深切地关注着女性、生态和社会问题。本文认为《复活》以女性和生态的独特视角,对沙俄男权社会的种种暴力和欺骗现象进行了大胆揭露和批判,那里的
目的:观察多种维生素对促红细胞生成素+铁剂改善早产儿贫血的强化作用。方法:将2006年7月~2008年12月收治的小早产儿(胎龄<34周,体重<2000g)40例,随机分为治疗组(A组,20例)和
在大学英语教学中重视对学生的智力因素培养无疑是重要的,但非智力因素对英语学习的正效应也是非常明显的.教师应充分认识非智力因素在英语教学中的重要性,在开发学生智力的
自2007年次贷危机以来,全球经济持续下滑,不良资产大幅攀升。我国政府先后出台了系列政策化解不良资产危机。由于不良资产信息缺失、可供借鉴的参考案例较少、信息高度垄断使
在英语教学中,良好的非智力因素有利于学生潜在的语言学习能力的发挥,有利于配合英语教学的顺利进行,有利于提高教学质量。必须注意培养学生学习英语的兴趣,意识到情感教学的
目的探讨生血宁在早产儿贫血早期干预作用以及用药安全性。方法通过对许昌市中心医院2005年1月—2011年5月100例贫血早产儿在生后4周开始服用生血宁片0.125mg/次,3次/d,连续
目的观察由鱼藤酮制备的帕金森病(PD)大鼠模型黑质多巴胺能神经元中氧化应激参数、转录因子NF-E2相关因子(Nrf2)及其基因产物血红素氧合酶1(HO-1)和依赖还原型辅酶/Ⅱ醌氧化