基于深度强化学习的推荐系统研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：szm2009szm

【摘要】

：

【作者】

：

单译葳

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

强化学习推荐系统异构信息网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

推荐系统被广泛应用于互联网的各个领域中,用来解决当前时代信息过载的问题。它不仅可以帮助用户快速筛选出感兴趣的内容,也为互联网公司创造出了巨大的商业价值。针对用户进行分析是个性化推荐系统的基础和前置工作。基于对某个用户的分析可以发现这个用户对不同物品感兴趣的程度。用户、物品和其他一些附属信息,比如标签信息、物品种类,共同组成了一个异构的信息网络。一般情况下,推荐算法会直接把用户描述为显式或隐式的评分,但是这样做忽略了用户、物品和信息网络中其他实体节点之间的相互联系。为了解决这个问题,本文会基于对异构信息网络的挖掘进行用户推荐。此前,在异构信息网络中解决推荐任务的方法很多是基于元路径的。但是许多现有方法完全依靠专家来提供元路径,很少有工作讨论如何生成高质量的元路径。这样做有两个弊端,一是在庞大而复杂的异构信息网络中,手动检索元路径可能会非常繁琐和困难。二是专家提供的元路径可能带有人为偏见。因此,我提出了基于深度强化学习的方法来挖掘异构信息网络中的元路径。此前,强化学习已经在推荐系统中有很多应用,但是与现有的方法不同,本文将强化学习的环境定义为由用户、物品以及其他信息组成的异构信息网络。总的来说,本文提出了一种在异构信息网络中基于深度强化用户分析的推荐系统算法。具体研究内容如下:1、环境被建模为一个异构信息网络,它由用户、物品和不同的信息源组成。在用户和网络中未被观察到的物品之间,本文采用了如下的多次迭代训练过程。有一个元路径库,可保留每次迭代时生成的元路径。最初,元路径库是空的,由专家给出的元路径进行填充。然后,将由强化学习智能体在每次迭代中尝试的元路径添加到元路径库中。更新的元路径库用于在下一次迭代中训练强化学习智能体。重复此过程,直到无法获得新知识或达到最大迭代次数为止。2、提出了一种基于元路径的用户分析方法,该分析方法记录了每个用户对物品的潜在偏好权重。在基于元路径的用户分析过程之后,提出了一种基于用户的协同过滤方法来完成Top-N推荐任务。3、在三个数据集上进行了实验。将所提出的方法与基线模型进行了评分预测任务和Top-N推荐任务的比较,本文还分析了生成的元路径的质量,实验结果验证了该方法的有效性。

其他文献

基于深度学习的被遮物体姿态估计

近些年随着深度学习的快速发展,基于深度学习的算法被广泛运用于二维目标检测和姿态估计中。在实际应用场景下,比如机械臂抓取、自动驾驶以及AR领域中,目标物体往往处在复杂的环境中,容易受到遮挡。针对遮挡场景下的物体6D姿态估计研究具有十分广阔的空间和重要的研究价值。因此本文开展基于深度学习的被遮物体姿态估计的研究,主要包括三部分:受遮挡情况下物体姿态估计问题研究,工业场景下物体自遮挡姿态估计问题研究,多

学位

6D姿态估计卷积神经网络深度学习遮挡场景

基于图神经网络的图学习算法研究

近年来,图神经网络在社交网络、推荐系统、分子化学和知识图谱等领域取得了显著的成果。一方面,它解决了深度学习方法难以处理非欧式空间数据的问题,另一方面,它提供了一种对非规则数据提取特征的方法。图结构数据是生活中广泛存在的一种数据结构,与欧氏空间的数据不同,图结构可以更好的反映节点之间的联系。随着图神经网络的迅速发展,许多针对图结构数据的研究也如雨后春笋般涌现,这些研究主要包括节点表示、链接预测和图学

学位

深度学习图神经网络图嵌入图学习

基于LSTM的扭摆定向参数决策与远程控制

扭摆滑动定向作业过程中,最常见的问题是“托压”,来自于固定的钻具与井壁之间的摩擦力。这一问题可通过扭矩摇摆技术解决,即向钻具施加正、反向扭矩,化静摩擦力为动摩擦力,以减少钻具与井壁间的作用力。目前由于缺乏相关理论支撑,在滑动定向作业过程中为使工具面转动至目标值,仍需通过扭摆系统人工对正、反向扭矩值进行调整,该方式依赖于工程师个人经验,各井的控制效果因人而异,参差不齐,作业效率较低。针对以上情况,依

学位

滑动定向钻井扭摆工具面状态LSTM自动控制

路径规划与多手臂老虎机算法的研究

路径规划一直是热门的话题和研究方向,如何及时捕获和提前预测车辆行驶时间的动态变化是解决路径规划的难点及重点,本文提出的算法能够在保证计算速度的同时,提高路径规划的准确度。本文从以下几个方向研究路径规划问题:如何最小化路径行驶时间的均值和标准偏差的（加权）线性组合来解决可靠最短路。在合理假设基础交通网络的行驶时间遵循多元高斯分布的情况下,提出了一种高斯过程路径规划（GP3）算法来计算先验最优路径作为

学位

可靠最短路高斯过程强化学习多手臂伯努利老虎机高斯过程主动路径规划时序差分法

基于深度学习的三维点云语义分割技术研究

三维点云语义分割是将点云中的每个点按照各自的类别进行语义的划分,对同一类别的点进行相同的标注。随着三维数据获取的难度变小,基于三维数据的技术开始逐渐发展,也已经开始应用在自动驾驶、智能机器人、遥感和医疗等领域中。点云语义分割算法是三维点云处理的重要方向之一,传统的点云分割方法精度不高,因此,本论文主要研究的内容为基于深度学习的三维点云语义分割,使用的基础网络为PointNet++,并对其从局部空间

学位

三维点云语义分割深度学习PointNet++几何信息增强编码附加信息编码

回复式神经网络若干关键问题研究

回复式神经网络（Recurrent Neural Networks,RNNs）是深度学习领域中的一种基础的人工神经网络,其作为处理序列数据的记忆模型被广泛应用。如何处理好梯度消失与梯度爆炸问题一直是训练RNN的关键和难点。长久以来,人们提出了多种方法来解决RNN训练时的梯度问题,不断设计新的RNN变体用以处理更长的序列。尽管许多经典的模型已经被提出,如何使RNN模型在快速应对序列中短期变化的同时捕

学位

深度学习回复式神经网络长期依赖学习分治策略

基于深度学习的姿态估计方法研究

计算机视觉发展过程中,人体姿态估计任务一直备受关注。在工业界和学术界,姿态估计任务也是极具挑战性的任务之一,目标是使机器尽可能的检测出人体样本中关键节点,比如鼻子、左右肩、脚踝、手腕。随着深度神经网络的引入和应用,人体姿态估计任务往往是预测人类行为规律的基础研究任务,为行人检测、样本重识别、特殊行为检测、人机交互等任务提供了基础预测能力。当前主流的人体姿态估计网络框架分为两种应用型网络,即人体结构

学位

卷积神经网络注意力机制网络架构搜索人体姿态估计

面向表面缺陷检测的深度学习平台设计与实现

在工业产品的生产过程中,通常会无法避免地产生一些表面缺陷,因此需要检测出产品的表面缺陷以便及时发现问题并且对产品质量加以控制。与人工检测方式相比,基于计算机视觉的工业表面缺陷检测方法,具有成本低、安全性好、效率高、灵活性好等诸多优势,已成为自动化缺陷检测系统的重点研究方向之一。针对工业生产中产品的表面缺陷检测问题,本文设计了一种基于计算机视觉的深度学习平台,在表面纹理较规律的缺陷检测任务中取得了很

学位

缺陷检测计算机视觉语义分割算法深度学习平台

图神经网络可解释性的研究与应用

近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过

学位

图神经网络可解释性初等数学自动解题

基于神经网络补偿光纤非线性的相干光通信系统研究

光纤通信向着高速率、大容量、远距离传输的目标发展,由于光纤损耗,需要使用光学放大,为增加传输距离,必须相应地使用越来越多的光放大器。光放大器也使噪声放大,为保持较高的信噪比,信号光功率需要增大。然而,当光信号功率超过一定值时,光纤内的非线性会增强,产生非线性干扰噪声。在长距离、高激光发射功率的光通信系统中,光纤中累积的非线性效应成为影响系统通信性能的主要因素,信号由于受到非线性而产生畸变,使得通信

学位

人工神经网络光纤非线性效应光纤非线性补偿相干检测反射式双向传输系统

基于深度强化学习的推荐系统研究

与本文相关的学术论文