基于协同过滤算法和强化学习的电影推荐系统

来源 :天津大学 | 被引量 : 0次 | 上传用户:xutao6310794
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展人们对于个性化的推荐的准确度的要求更高,互联网的用户对于网上观看电影的需求也是越来越旺盛,电影网站的电影的数量也在持续的增长,现在的网站的电影数量是海量的,个性化的电影推荐系统的精确度对于一个电影网站来说也越来越重要,可以使得用户在该网站的停留时间更加长久,也使得用户在该网站获得自己感兴趣的电影。由于在个性化的电影推荐的领域,电影数据的稀疏性以及用户需要很久的时间才可能会更新数据,这样的数据对于采用神经网络进行在线的电影推荐会导致推荐的结果不准确。本文提出了一种全新的电影推荐框架叫做CF-DQN推荐框架,它是基于协同过滤算法的改进的强化学习的电影推荐框架,用于实时的电影推荐。解决的是电影推荐领域中由于电影推荐的数据的稀疏度很高以及兼顾到推荐的准确性和电影类型的多样性的原因采用混合算法来进行电影的推荐。本文基于用户的协同过滤算法是最早流行的协同过滤算法之一,具有完整的数据集和高精度的算法,然而传统的推荐算法仅考虑了用户的性质而忽略了用户的关系,因此本文中提出了三度信任的关系模型,用来增加用户数据之间的联系,同时由于电影数据的稀疏性很强,需要膨胀用户的数据来提高神经网络训练的效率。由于用户对选择看的电影的类型会因为时间的变化而发生变化,本文提出了对电影评分的时间进行加权,这样使得推荐结果更加的准确。本文采用强化学习的框架对电影数据进行马尔科夫决策过程建模,采用deep Q-learning(DQN)算法作为动作值函数的近似计算,对于实现电影推荐的多样性的目的本文采用的是强化学习框架中的-Greedy随机策略作为最后的推荐结果,来防止出现信息茧的结果。但是在利用DQN网络推荐的过程中也是会存在一定的滞后性,因为在训练神经网络的时候需要的是在一定的步长下才会训练参数,所以这个过程中采用的是改进协同过滤算法的实时推荐部分,两个实时的部分进行同时推荐,这样使得推荐结果更加多样化和实时结果更加的贴切于实际,解决了协同过滤算法使得用户陷入信息茧的弊端。本文用的数据集来自于Movie Lens,在进行了常规的top K的电影推荐的实验后表明基于改进后的协同过滤算法的强化学习的框架在能保证推荐结果准确率的基础上,整体多样性相比于传统的方法协同过滤算法和机器学习的算法等一些混合方法和单纯使用强化学习中的DQN神经网络等都有所提升。
其他文献
针对目前基于深度神经网络的柱塞泵故障诊断方法在小样本条件下精度低、模型欠拟合问题,提出了一种小样本条件下基于孪生神经网络的柱塞泵故障诊断方法。搭建了柱塞泵故障试验台,采集柱塞泵在不同健康状态下的壳体振动信号;使用由卷积层和池化层组成孪生子网络自适应地从原始振动信号中提取低维特征,使用欧式距离判定输入样本对的特征相似度;通过相似度对比的方法扩大训练样本数量并训练孪生神经网络模型;最后对测试样本进行健
<正>周璨安徽省黄山市屯溪四中八年级(5)班245000梁颖广东省肇庆市封开县长安中学七年级(13)班526531黄艺璇福建省漳州市长泰县第五中学八年级(5)班363900
期刊
地面钻井抽采采空区卸压瓦斯具有流量大、浓度高等特点,目前已在我国广泛应用,可在预防瓦斯灾害的同时,实现煤、气的安全开采。研究地面钻井对采空区卸压瓦斯控制机制对提升地面钻井瓦斯抽采效果具有重要意义。然而,目前针对地面钻井的研究主要集中于钻井围岩特性、产气规律和井身稳定性等方面。本文采用理论分析、物理相似模拟实验和数值模拟相结合的方法,研究了地面钻井抽采对采空区三维空间瓦斯运移和分布的影响特性,分析了
文章为研究对比不同形态(成品颗粒状料、成品粉状料和自制颗粒状料)开食料对早胜哺乳犊牛生长发育的影响,试验选取60头刚出生体重接近的早胜犊牛,随机分为3个试验组,组1投喂成品颗粒状料,组2投喂成品粉状料,组3投喂自制颗粒状料,每头犊牛单独饲养。试验共计90 d,其中1日龄~7日龄自由采食初乳;8日龄~60日龄正常采食母乳+自由采食开食料;61日龄~70日龄减少常乳采食量+自由采食开食料;71日龄~9
基于重庆市2017年以来的225份调研数据,以产量数据前5%的平均值为产量潜力,产量水平为分类依据,分析当前小农户生产的施肥现状、产量差及其影响因素、化肥减施潜力,以期为区域花椒生产增产增效提供参考依据。重庆花椒平均产量为8.66 t/hm2,产量潜力为16.7 t/hm2,产量差达8.02 t/hm2,当前椒农平均生产水平仅实现了产量潜力的52%,高、中、低产农户的产量差分别为3.11、7.84
随着经济社会的持续发展,城镇化的快速提高,城市人口的逐渐增加,建筑项目的日益增多,给行业监管部门带来了新的挑战。文章着重从建筑行业主管部门安全监管方面与大家共同探讨。
文章选择不同释放速率的包被丁酸钠,研究开食料中添加包被丁酸钠对哺乳犊牛免疫和抗氧化机能的影响。试验选择出生5 d内的公犊牛40头,随机等分为4组:对照组、Z组、N组和E组。对照组不添加丁酸钠,Z组、N组和E组分别添加不包被丁酸钠、释放速率快和慢的包被丁酸钠。结果显示:与对照组相比,Z组、N组和E组显著提高血清免疫球蛋白G含量(P<0.05),显著降低白细胞介素1β和肿瘤坏死因子α含量(P<0.05
近年来,计算机技术迅速的发展逐渐改变着建筑行业。智能化成为建筑行业发展必须要走的道路。在近几年的建筑行业中,建筑智能化已经基本成为建筑的标配,这就对计算机应用和物联网应用与建筑提出了更高的挑战。文章概述了建筑智能化系统的概念、建筑智能化的必要性,总结了建筑智能化的发展现状,分析了建筑智能化的发展前景,以期为建筑行业的智能化发展提供一定的理论和实践依据。
在对现状大规模林业生态工程开展过程中存在问题进行总结的基础上,分析指出了EPC模式在林业生态工程的应用优势,并通过结合具体工程案例阐述了大规模林业生态工程采用EPC模式时的适用范围、开展流程和不足之处,以期为后续类似项目进行项目管理时提供经验借鉴。
针对风电机组齿轮箱故障数据维度高、相关性强、信息特征交叉等特点,采用保局投影和模糊c-均值聚类相结合的方法进行齿轮箱故障诊断。通过保局投影进行故障特征提取,解决数据处理难、信息交叉等问题;加入数据权和抑制因子改进模糊c-均值聚类算法实现特征分类,克服传统聚类算法分类“非此即彼”的缺点;诊断模型计算隶属度诊断数据属于某类的可能性,避免强制分类而带来的误判。最后算法经QPZZ-II旋转机械振动试验平台