基于多行为隐式反馈的在线推荐方法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:lb878719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是目前用来缓解信息过载的常用技术。个性化推荐系统依赖于用户的行为反馈数据,包括显式反馈和隐式反馈。诸如点击和收藏之类的隐式反馈由于其收集成本低廉,数据量大并且含有更加丰富的隐藏信息而被广泛研究并应用于推荐系统中,其应用的难点在于对用户行为的解释,隐式反馈的解释高度依赖于各应用领域。本文将电商领域基于多行为隐式反馈的在线推荐问题形式化为多臂赌博机问题,提出了一种基于多臂赌博机的在线推荐模型。该模型主要包含三个模块:环境、动作(臂)集和bandit算法。通过bandit算法与环境的交互不断优化策略,以实现最大化累积奖励,为用户提供在线推荐服务。bandit算法是模型的核心模块,本文提出基于多行为隐式反馈的汤普森采样算法(MIF-TS),该算法主要根据臂的预期奖励分布进行随机采样,选择最佳臂产生推荐。本文在三个公共数据集上验证了所提出的模型和算法的有效性,并讨论了影响模型的因素以及提出模型在冷启动环境下的差异化推荐策略。实验结果表明,所提模型和算法能有效利用用户多行为隐式反馈获取用户偏好,解决推荐中的探索/利用权衡问题;并且模型在冷启动环境下具有鲁棒性,采用预训练的方式进一步优化了冷启动下的推荐效果。本文的主要工作和创新点归纳如下:(1)提出了一种基于多臂赌博机的在线推荐模型,该模型具有两个独特的特征。首先,使用根据用户行为和产品属性筛选的产品子集而非单个产品作为臂,这不仅避免了大规模臂的复杂性,还能充分利用上下文信息获取用户偏好,使得推荐具有可解释性。其次,与常见的伯努利奖励设置不同,本文将用户的多行为反馈分为强交互行为和弱交互行为,并赋予它们不同权重的奖励,用以更新臂的预期奖励分布。此外,还提出了结合用户当前偏好和历史偏好的不同臂推荐策略以适用于不同场景。(2)提出了基于多行为隐式反馈的汤普森采样算法MIF-TS。算法假设每个臂的预期奖励服从独立的Beta分布,使用多行为隐式反馈更新后验分布,以使臂的预期奖励分布逐渐接近真实的平均奖励。从后验分布中进行随机采样,选择采样值最大的臂进行推荐,有效平衡了探索与利用,保证了推荐的准确性和多样性。(3)本文在三个具有不同特征的公共数据集上进行了实验,评估了所提模型和算法的性能,深入分析了模型中的几个重要影响因素,并探讨了该模型处理冷启动问题的能力。
其他文献
点击率预测一直是在线广告和产品推荐领域中非常受欢迎的问题,点击率的小幅增长可以带来可观的利润回报。近年来,由于机器学习和人工智能技术在自然语言处理及计算机视觉等众多领域中取得了令人瞩目的成绩,各研究机构和互联网企业纷纷将相关知识应用于点击率预测问题,并为此做了许多研究和探索,取得了诸多出众的成果。本文通过综述近年来点击率预测相关的论文发现:点击率预测的准确性主要受到数据特征规模大、维度高和稀疏性等
在筒子纱染色领域,卷绕密度的测量主要为传统的人工理想化计算和利用硬度计间接测量,存在测量结果准确性不理想、测量过程耗时较长等问题,且仅能以抽样测量的方式进行,以样本数据代替整体,无法对全体对象实现精确测量,导致对筒子纱染色质量的控制存在不确定性,完全不能满足生产的高效率、高精度、高质量需求,且生产环境较恶劣,对工作人员的健康存在安全隐患。研究高精度、高性能的筒子纱卷绕密度自动化测量技术,可解决传统
我国社会正逐渐步入老龄化,以阿尔兹海默症为代表的精神疾病正在危害老龄人群的生命健康。海马体作为大脑神经系统的重要组成部分,其体积结构的变化正是诸多精神类疾病早期病灶的临床特征之一,所以实现海马体MRI图像的有效分割对于相关精神疾病的诊断与治疗有着十分重要的意义。然而传统通过人工的方式对海马体图像进行分割,不仅对操作人员的专业水平要求高,而且易受主观因素等影响出现误分割情况。因此如何利用深度学习技术
随着电子商务的快速发展,越来越多的消费者倾向于在网上购买商品。目前,电商平台主要通过关键字匹配的方式来检索服装,这些服装由卖家拍照并采用人工的方式进行分类。作为服装检索过程中的一个重要环节,服装分类直接影响商品的销售和用户的消费体验。由于服装图像数量庞大,服装分类是一项繁琐而艰巨的任务,采用人工分类的方式效率低下、错误率高。因此,基于计算机视觉的服装图像分类已成为目前工业服装分拣、电子商务等领域的
随着人们生活水平的提高,高品质个性化的现代时尚文化促进了服装定制产业的快速发展。近来,新一代信息技术诸如5G宽带通信、人工智能AI、物联网IOT等与服装行业交叉,服装虚拟试穿技术成为了国内外研究热点。其中,交互式个性化服装虚拟体验模式展现时尚定制的前端需求,体现了以“人”为中心的时尚发展方向,对现有的服装计算机仿真设计是一种重要补充。依据3D视觉传感理论、服装仿真建模原理、以及Unity3d、Ma
电纺膜是由天然或人工聚合物溶液,在高压静电作用下纺丝生成,具有孔隙率大、比表面积高和透气性好等优点,在电池隔膜、传感器和医疗防护等方向都有很高的应用价值。然而,静电纺丝的工艺较为复杂,产品的缺陷问题难以避免。缺陷损害了电纺膜的过滤和物理性能,造成生产效率的下降以及原材料的浪费。目前,关于电纺膜质量检测的研究较少,且大多集中在取向、直径及孔隙率的测量等方向,微观层面上的缺陷检测更是鲜有研究。另一方面
近几年来,随着制鞋业的快速发展,制造运动鞋的企业越来越多。传统制鞋工艺大部分依靠人工,对工人的技术要求很高,生产的运动鞋质量不稳定。鞋底涂胶在制鞋流程中,占用工人最多,且胶水对工人的身体有害。因此,将机器视觉和机器人技术引入运动鞋自动化生产中具有十分重要的意义。首先,结合冷粘运动鞋工艺要求,对其中鞋底喷胶工艺的机器人自动化方案进行了详细的设计。基于面阵相机、线结构光传感器搭建了鞋底三维信息重建机器
随着移动通信技术的发展,移动边缘计算得到了越来越广泛的关注,并为未来各种时延敏感型以及计算密集型应用提供了技术保障。特别是移动边缘中的任务卸载技术的发展,为边缘设备在资源受限场景下的任务卸载决策以及资源分配提供了更好的解决方案。此外,移动边缘计算隐私保护技术的发展也为未来用户可以体验更加丰富多彩的网络数码世界提供保障。但目前移动边缘计算技术的相关研究依旧存在许多不足,现有的任务卸载算法在复杂的移动
航天结构件需满足极端服役环境,对产品质量与性能要求极高。其加工过程涉及信息复杂,对加工结果影响巨大。传统的加工过程信息传递模式,存在信息来源离散、表达方式落后等问题,难以保证加工效率和产品性能。数字孪生可以实现工件虚实映射,达到加工过程信息集成的目的。而增强现实技术是一种高效的人机交互技术,能够将虚拟信息融合到物理世界中。本文研究了一种基于增强现实的航天结构件数字孪生加工过程信息虚实融合与交互技术
知识图谱是人工智能应用重要基础资源,以人工智能与制造业结合的智能制造领域也逐渐成为新一代产业革命的核心发展方向。高价值的复杂产品因其复杂性,导致装配困难易错,装配指南便成为了非常重要的辅助工具,利用知识图谱这种图结构的数据格式来储存装配信息数据,更便于这类复杂知识在计算机系统中的存储与检索,以实现装配的快速问答与时效性强的指导,将装配环节也推进到智能制造。本文基于知识图谱技术工具,结合交互设计方法