结合双重心理动机建模和强化学习的个性化推荐

来源 :天津大学 | 被引量 : 0次 | 上传用户:NewComeMan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐系统能够提供给用户个性化对象或服务,在减轻信息过载问题方面发挥着至关重要的作用。然而,一个好的推荐系统不仅仅是推荐给用户符合其心意的对象,还要能够挖掘用户的兴趣,因此了解真实场景下影响用户选择的真实原因是非常必要的。在真实场景下,影响用户选择的真实原因是用户的心理动机,根据心理学中对动机的阐述,其主要包括内在动机和外在动机两部分。其中,内在动机是指建立在个体内在想法的基础上的,外在动机是来自于个体外在的影响。然而,在当前推荐模型中,用户的历史选择信息和用户与对象的辅助信息相结合的合理性及优势来源于对内在动机的间接刻画。而当前方法上缺乏对外在动机的刻画,以及对两种动机的联合建模。为了实现对双重动机的联合建模,我们选用了深度学习与强化学习结合的方式。首先我们使用深度学习模型即堆叠多层降噪编码机Stacked Denoising Auto-Encoder(SDAE)模型来利用用户的历史选择信息和用户与对象的辅助信息同时建模用户和对象并得到初步的用户和对象的潜在特征表示,并利用了贝叶斯概率矩阵分解(BPMF)对用户与对象的潜在特征表示进行了优化。在用户和对象的潜在特征表示的基础上,我们提出了基于Q-learning(Off-policy)方法对用户的两种心理动机进行建模,并将心理动机中的效价表现在推荐系统中的奖惩机制。在具体建模中,我们主要有两方面的改进和贡献:(1)基于深度学习模型与BPMF模型的融合,将用户的历史选择信息和用户与对象的辅助信息的融合使得用户和对象的潜在特征表示更加有效并且缓解了数据稀疏和冷启动问题,而且减轻了由深度学习模型参数众多引起的过拟合,提高了模型的准确率。(2)基于Q-learning(Off-policy)的两种心理动机的融合进一步的缓解了冷启动问题,并且使得推荐性能显著提高。为了检验我们提出模型的有效性,我们在两个开源电影数据集上进行实验,并用两个评价指标进行测试,实验表现很好。
其他文献
我国高等院校在很长一段时间内致力于对教师培训管理系统的改进,立志于建立一个更适应当代社会的教师培训管理体系,抛开最原始的Excel表格登记方式,更深层次的了解每个受培训
节子是木材的一种缺陷,而死节数量和节子变色是评价木材等级的重要指标。修枝是减少树木节子,提高木材质量的重要经营措施,修枝的效果与修枝强度密切相关。水曲柳(Fraxinus m
随着可再生能源发展规模及电力系统容量的持续增长,传统交流电力系统已难以满足用户对电能的需求。近年来高压直流输电技术凭借功率调节灵活、输电线路架设便捷、运行损耗小
近年来,奇异摄动微分方程的层适应数值解法受到许多学者的青睐。在这种算法中,我们主要考虑从两个方面提高数值解的精度。一方面是网格函数的构造,另一方面选择合适的差分格式来离散奇异摄动边值问题。为了寻求适当的层适应网格以及与网格相匹配的差分格式,人们需要考虑奇异摄动罗宾边值问题精确解及其分解的性质,同时还要处理好罗宾边界条件使得整体误差阶数得到提高。本文即从以上几个方面入手,做了如下工作:(1)利用比较
能源与环保问题已经成为了21世纪人类必须解决的重大课题之一。到今年已经有着135年历史的汽车行业在最近几年中,新能源汽车异军突起,中国也有望借着新能源汽车的东风使其在
苹果炭疽叶枯病(Glomerella leaf spot of apple)由胶孢炭疽菌(Colletotrichum gloeosporioides)引起。病害连年的发生,对各地苹果产业和农业经济造成严重的损失。夏季雨热同
以11年生白桦(Betula platyphylla)人工幼龄林为研究对象,在管理单元划分、营养诊断的基础上结合中国东北样带(NECT)速效养分梯度分布计算推荐施肥量;通过“3414”部分试验设
第一部分BML-111减轻脓毒症所致的认知功能损害目的:探讨BML-111对脓毒症所致的认知功能损害的影响。方法:采用盲肠结扎穿孔法(cecal ligation and puncture,CLP)诱导脓毒症
地震是一种突发性和毁灭性的自然灾害现象,其造成的经济损失非常严重。减隔震支座是目前应用比较成熟的抗震形式,摩擦摆减隔震支座是一种性能优良的摩擦耗能隔震支座,近年来,
冷弯型钢作为钢结构种类的一种,与热轧型钢相比,具有令人满意的强重比,更能体现钢结构“轻”、“省”特点。随着生产工艺提高,越来越多冷弯厚壁型钢应用于建筑设计当中。观察