基于时间和语义感知的推荐方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:cyuch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要是关于推荐方法的研究,该任务目的是预测用户对给定物品或对象(如酒店,视频,商品,音乐等)的打分或喜好。现有的主流解决方案是通过协同过滤或者基于内容的过滤方法产生一个推荐的排序列表。这些方法在很多的推荐系统上的表现是很有前景的,并且它们经常被结合在一起得到混合的推荐方法。然而,每种类型的方法都有它的优势和劣势。比如,协同过滤方法经常会出现三个问题:冷启动问题、可扩展性问题和稀疏性问题。而基于内容的方法被三个问题限制:有限的内容分析、过特殊化和对新用户的冷启动问题。针对上述推荐方法存在的问题,本文调查研究用户兴趣的时间变化、物品内容的语义信息、用户对每个对象多方面特征的特殊兴趣,以提高推荐算法的效果。首先,本文建立一个有效的方案进行时间和语义感知的酒店推荐,方案考虑了用户对酒店多方面属性的特定需求、用户预订酒店的时间动态性和评论文本语义信息分析,这些因素对于酒店推荐有着重要的作用。具体的,本文提出基于泊松张量分解和隐语义模型的学习方法,以进行时间和语义感知的酒店推荐。通过挖掘用户预订酒店的时间、用户-酒店的多方面打分和用户评论文本信息在潜在空间的表达,本文提出的方法能够更加精准的预测用户对酒店的偏好,并且模型能够泛化到冷启动的新用户,预测只有少部分评论文本的用户的多方面偏好,进而有利于对新用户进行酒店的推荐。其次,本文深入探索用户行为的时间序列信息对用户偏好学习的影响,并且考虑用户对于每个对象多方面特征的偏好。本文证明这种考虑对于预测和推荐用户可能喜欢的下一个对象具有促进作用。基于此,本文设计了一个基于注意力机制的协同神经网络框架,进行时间和语义感知的短视频推荐,以提高短视频推荐的性能。具体的,本文提出的方法包含:短视频的编码器——捕捉短视频多模态特征的不同重要性,进而学习短视频特征表达嵌入;用户偏好的解码器——用于区分用户的历史交互记录,建模序列行为交互,学习用户的偏好表示;打分解码器——接收一个新的短视频作为输入,来预测用户偏好或打分,进而得到短视频的排序列表,然后进行推荐。本文展示注意力机制网络如何和协同过滤结合来建模用户-视频的交互行为,进行时间序列和内容语义感知的短视频推荐。本文在一些真实世界数据集上进行了丰富的实验。在酒店推荐方面,本文从TripAdvisor网站上爬取用户对酒店的评论建立用户-酒店交互数据集,并且也在公开的数据集上进行了实验验证。在短视频推荐方面,本文从奶糖短视频和抖音短视频平台上爬取用户喜欢或点赞的短视频历史记录,建立短视频数据集。从实验结果中本文可以得到如下结论:第一,多种多模态信息结合可以帮助提高用户兴趣的预测和推荐的精度。并且,考虑用户对于物品多方面特征的喜好需求,有助于挖掘用户潜在偏好。第二,时间动态性和时间序列性对于用户的行为建模有着重要作用。第三,内容语义信息,如文本、视频视觉内容等,可以提高对象表达的精准性,进而提高推荐效果。
其他文献
时至今日,中国离2020年全面脱贫的目标已越来越近,而中国西北地区由于其生态环境恶劣、地理位置较深等原因,一直以来经济发展水平都落后于中东部地区,因此当中国扶贫工作进入
生活垃圾渗滤液作为垃圾卫生填埋过程中产生的高浓度有机废水,严重影响垃圾卫生填埋场的运行及其周围生态环境。寻找一种合理高效的渗滤液处理技术是保障填埋场良性运行的关
近年来,金属铬及其化合物广泛应用于电镀、金属加工、制革、油漆、颜料、印染等工业生产的各个领域中。随之而来的铬污染问题引发国内外学者越来越多的关注。因此,寻找出一种
近年来,人体器官移植技术已经在医疗领域发挥了不可替代的重要作用,为人类发展提供了不可或缺的生命科技。但由于我国医院内进行的器官移植手术的器官来源基本靠器官捐献,社
纵观我国排球的发展轨迹,一直备受国人关注的事情就是中国女排的兴衰与成败,从1976年中国女排开始重新组建到现在,以惊人的毅力,顽强的拼搏精神,站在了世界排球锦标赛、排球
接触测量是一种常见的在体测量方式。在测量过程中,接触压力的变化会影响漫反射光谱的稳定性,从而对测量结果造成干扰,影响建模的效果。为了削弱人体抖动等带来的接触压力波
随着人工智能技术受到人们越来越广泛的重视和应用,贝叶斯网络作为经典的机器学习算法,以其概率推理准确和语义表达清晰的优势,在不确定性建模和概率推理等问题上得到了广泛
二十世纪后半叶的法国文坛中,米歇尔·图尼埃是一位不容忽略的大家。他的作品虽然在叙事形式上并无“新小说”派那样颠覆性的改革,但仍以其中蕴含的神话和历史渊源、深邃的哲
密度极限问题是所有低杂波电流驱动实验都无法回避的问题,如何提高高密度条件下的电流驱动效率是目前低杂波电流驱动研究的重点。相对于低场侧区域,托卡马克内的高场侧区域具
随着智能移动设备和社交网络服务的快速增长,现有的无线网络承载着越来越大的负载压力。雾无线接入网可以通过将流行内容缓存到距离用户较近的接入点来缓解网络拥塞,用户无需从云服务器获得所请求的内容,因此前传数据得到卸载,并且传输时延得以降低。在雾无线接入网中,雾接入点具有一定的缓存容量和计算能力。一方面,由于缓存容量和计算能力的限制,为了达到更好的网络性能,雾无线接入网中的性能分析变得越来越重要,另一方面