面向稀疏数据的可解释性推荐方法研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:nimabe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,从网上购物、视听娱乐到生活旅游等方面,人们的日常行为和决定越来越多地受到推荐系统的影响。所谓推荐即是根据用户的历史、项目的相关属性进行建模,从海量的信息中,推断出用户的兴趣爱好,帮助用户找到感兴趣的项目。推荐系统的技术核心是如何从巨量信息中为用户挖掘出有效的信息。然而,传统的推荐算法里已有的数据稀疏性问题,会致使推荐质量不太理想,无法更好地提升用户对系统的满意度。再而,因缺少系统给出的推荐结果的解释说明,降低了用户对系统的信任度。现为解决这样的问题,提升推荐系统给用户的体验,本文从推荐系统存在的数据稀疏性问题和不可解释性问题出发,在提升推荐系统的准确性和可解释性两方面展开,通过将知识图谱引入推荐系统,分别提出了推荐概率预测模型和路径级的推荐解释模型。推荐的准确性作为本文的第一个任务,其依然是推荐算法的首要研究点,数据稀疏性问题目前仍是制约推荐质量进一步提高的瓶颈。为缓解推荐算法中数据稀疏的问题,提升推荐的准确性,目前存在的相关工作从不同切入点对用户和项目信息进行分析、处理,以降低数据的稀疏程度,但仍然存在以下不足:1)在传统协同过滤算法中,将附加信息融入推荐以缓解数据稀疏,存在数据间相关性无法捕捉的问题,会限制推荐准确性进一步提升;2)在深度协同过滤算法中,以学习到的特征来缓解数据稀疏,存在对数据深层次理解的问题,因机械式地特征拟合会造成推荐准确度的偏差,且深度学习具有“数据饥饿”的特点。针对推荐准确性任务在现有研究中的不足,本文的主要工作如下:●提出了KGE-CF模型,此模型首先从用户的交互历史项目出发,利用一种多源结构化的数据,即项目之间的知识图谱。该模型首先通过实体间语义依赖关系,来丰富项目数据信息,以缓解稀疏。其次,KGE-CF模型将学习到的用户偏好向量与项目向量结合输入到多层感知机中,充分学习出用户与项目间的高阶交互信息,从而预测用户偏爱项目的概率,此模型具有良好的推荐效果。推荐的可解释性是本文研究的第二个任务,推荐结果的可解释性是提升系统透明度、用户信任度及满意度的关键所在。作为可解释人工智能领域的一个重要分支,可解释推荐系统的研究现已受到金融、医疗等多个领域的关注。推荐系统的可解释性能够进一步增强用户认可度和信任度,并为开发和研究可解释机器学习提供合适的背景。为了使推荐内容更容易被用户所接受,改善用户体验。本文做出的主要工作如下:●提出了KPCRN模型,首先利用深度搜索从知识图谱中提取用户历史交互项目的语义路径,然后通过文本卷积神经网络与循环神经网络对用户与项目的连接路径建模,最后利用权重池化得到用户对项目的偏好概率。对于提取出的路径都能显式推断,从而达到使推荐系统具有路径级推荐解释的目的。通过在真实数据集(Movielens,Book-Crossings,Last.FM和KKBox)上的实验,结果证明了本文提出的基于知识图谱的高阶协同过滤KGE-CF推荐模型能够缓解数据稀疏,提高推荐准确率,具有良好的预测效果;提出的知识路径卷积循环网络KPCRN模型,在提升推荐系统性能的同时,能有效解决推荐结果不可解释的问题,对推荐结果具有路径级的显式解释。
其他文献
时尚分析在时装产业、精准营销、社会行为分析等领域具有巨大的潜力,近几年越来越受到人们的关注。目前的时尚分析工作大多集中于分析服装的流行风格与流行趋势,而很少有学者关注人脸妆容的流行元素。人体的软生物特征提供人体中级描述,可以根据属性划分出具有某个特质的人群,如人脸具有多种属性,包括性别、年龄、种族、发型、发色等。本文主要致力于通过对人脸软生物特征的分析来获取唇色和发色的流行色。对于此任务,本文主要
基于视频的单目标跟踪作为计算机视觉研究领域中的基础性研究一直广受关注。通过提取视频初始帧提供的目标信息及其周围的背景信息,目标跟踪算法对后续帧中目标可能出现的区域进行预测。单目标跟踪的应用价值在多个领域都有充分体现。因此,继续对单目标跟踪算法进行深入研究依然十分重要。由于卷积神经网络在计算机视觉领域中的优越表现,现在主流的单目标跟踪算法的研究大都基于卷积神经网络进行方法设计。然而,基于卷积神经网络
飞行模拟机是训练飞行驾驶员在地面上虚拟飞行的有效设备,飞行模拟机给飞行驾驶员带来真实感的原因之一就是它逼真的视景系统,可以将飞机上可见的一切视景以虚拟的方式呈现在飞行驾驶员的眼前。当训练飞行驾驶员时,除了起飞和降落的场景都是在空中,所以云是飞行驾驶员在空中最常遇见的场景也是飞行模拟视景仿真中不可或缺的场景。相对于游戏或影视中的三维云场景而言,飞行模拟机中的三维云场景有着不一样的需求,第一,云层在飞
室外的场景通常有大气中的混浊介质存留,由于大气的吸收和散射形成了雾霾。图像采集设备受到雾霾的影响,导致获取到的图像清晰度降低、对比度下降,严重时还会导致色彩和细节信息发生变化或失真。近年来,计算机视觉技术已经普及和深入到各个行业的应用当中,在道路、航空等领域发挥着越来越重要的作用,而雾霾天气严重威胁了交通的安全。为了各类计算机视觉系统在雾霾环境下能正常工作,使得后续开展的图像分割、目标检测、图像识
近年来,合成孔径成像(Synthetic Aperture Imaging,SAI)系统中的光场成像受到研究人员的广泛关注。与传统的单个相机只能记录场景光线的二维平面信息不同的是,光场成像不仅记录场景的二维平面信息,同时记录场景光线的角度信息。由此,可以通过设定不同的参数获得不同焦距、景深(Depth of Field,Do F)的图像,在图像处理上带来了极大的便捷。利用计算成像的这些特性,也为视
颈椎作为承载人体头部的重要部分,头部的所有运动都是颈椎运动耦合的结果。随着社会发展,人们室内工作时间增加,长时间的久坐成为颈椎病发生的常见原因,最近颈椎病患者有年轻化的趋势。临床医学主要靠人体颈椎能够运动的角度范围来对颈椎正常状态进行诊断,目前临床上主流的检测颈椎运动角度的方法是利用影像医学,一般是通过拍摄颈X片的方式来评估颈椎运动功能。一种方便医生与患者的颈椎活动角度测量方法对于医生对患病程度判
随着互联网的不断发展,移动应用的需求快速增长。移动应用的质量保证是决定其成功的主要因素。测试自动化可能是提高移动应用程序质量并降低测试成本的有效解决方案,但实现移动应用的自动化功能测试是复杂且困难的,它是一项昂贵且耗时的活动,并面临诸多挑战。目前主要面临两大挑战,即测试序列自动生成和测试Oracle自动获取问题:(1)如何自动生成功能测试的测试序列,以达到自动化功能测试的目的?(2)如何自动获取测
区块链作为一种去中心化的新型分布式计算范式,具有多方创造信任、安全自治、不依赖可信第三方等特性,得到了越来越广泛的关注和应用,从最初的数字货币应用场景,逐渐拓展到了金融、贸易、征信、版权保护等诸多行业领域。联盟链相较于公有链拥有更高的交易性能和良好的监管特性,广泛受到各组织机构的青睐,其应用场景也在各行业领域得到了极大的拓展。联盟链在发展和应用过程中也遇到了各种问题与挑战,特别是联盟链的可扩展性问
人体行为识别是计算机视觉中一种重要的场景分析技术,目前已经得到广泛应用。基于视频的人体行为识别方法存在识别率不高的问题,这与视频帧提取中关键信息丢失、冗余信息较多等因素有关,也与在面对复杂场景时,使用单一特征难以对人体行为进行充分表达等因素有关。本文针对关键帧提取和人体运动视频的多特征表达进行研究,主要工作和创新点如下:(1)针对基于关键帧提取的人体行为识别,提出了一种基于动态双向时空切片聚类的关
随着科技水平的提高和社会的发展,在物质生活已经得到满足之后,人们开始更加关注精神生活的水平,很多丰富精神文明的商品成为大家追逐的目标。其中,智能手机和家庭影院的普及,让人们能享受到更好的拍摄和观看的体验。但光学领域的研究中,由于镜头的透镜在生产时无法达到理想的精度而且在组装过程中也可能产生偏差,最后会使得到的图像产生畸变,影响人们的观看体验。相机镜头产生的畸变按种类分为:径向和切向。径向畸变是因为