论文部分内容阅读
本文主要是关于推荐方法的研究,该任务目的是预测用户对给定物品或对象(如酒店,视频,商品,音乐等)的打分或喜好。现有的主流解决方案是通过协同过滤或者基于内容的过滤方法产生一个推荐的排序列表。这些方法在很多的推荐系统上的表现是很有前景的,并且它们经常被结合在一起得到混合的推荐方法。然而,每种类型的方法都有它的优势和劣势。比如,协同过滤方法经常会出现三个问题:冷启动问题、可扩展性问题和稀疏性问题。而基于内容的方法被三个问题限制:有限的内容分析、过特殊化和对新用户的冷启动问题。针对上述推荐方法存在的问题,本文调查研究用户兴趣的时间变化、物品内容的语义信息、用户对每个对象多方面特征的特殊兴趣,以提高推荐算法的效果。首先,本文建立一个有效的方案进行时间和语义感知的酒店推荐,方案考虑了用户对酒店多方面属性的特定需求、用户预订酒店的时间动态性和评论文本语义信息分析,这些因素对于酒店推荐有着重要的作用。具体的,本文提出基于泊松张量分解和隐语义模型的学习方法,以进行时间和语义感知的酒店推荐。通过挖掘用户预订酒店的时间、用户-酒店的多方面打分和用户评论文本信息在潜在空间的表达,本文提出的方法能够更加精准的预测用户对酒店的偏好,并且模型能够泛化到冷启动的新用户,预测只有少部分评论文本的用户的多方面偏好,进而有利于对新用户进行酒店的推荐。其次,本文深入探索用户行为的时间序列信息对用户偏好学习的影响,并且考虑用户对于每个对象多方面特征的偏好。本文证明这种考虑对于预测和推荐用户可能喜欢的下一个对象具有促进作用。基于此,本文设计了一个基于注意力机制的协同神经网络框架,进行时间和语义感知的短视频推荐,以提高短视频推荐的性能。具体的,本文提出的方法包含:短视频的编码器——捕捉短视频多模态特征的不同重要性,进而学习短视频特征表达嵌入;用户偏好的解码器——用于区分用户的历史交互记录,建模序列行为交互,学习用户的偏好表示;打分解码器——接收一个新的短视频作为输入,来预测用户偏好或打分,进而得到短视频的排序列表,然后进行推荐。本文展示注意力机制网络如何和协同过滤结合来建模用户-视频的交互行为,进行时间序列和内容语义感知的短视频推荐。本文在一些真实世界数据集上进行了丰富的实验。在酒店推荐方面,本文从TripAdvisor网站上爬取用户对酒店的评论建立用户-酒店交互数据集,并且也在公开的数据集上进行了实验验证。在短视频推荐方面,本文从奶糖短视频和抖音短视频平台上爬取用户喜欢或点赞的短视频历史记录,建立短视频数据集。从实验结果中本文可以得到如下结论:第一,多种多模态信息结合可以帮助提高用户兴趣的预测和推荐的精度。并且,考虑用户对于物品多方面特征的喜好需求,有助于挖掘用户潜在偏好。第二,时间动态性和时间序列性对于用户的行为建模有着重要作用。第三,内容语义信息,如文本、视频视觉内容等,可以提高对象表达的精准性,进而提高推荐效果。