论文部分内容阅读
在当今信息过载的时代,推荐系统已成为各互联网应用的核心组件,并深刻影响着人们的日常生活。例如,电子商务网站中的商品推荐服务为用户提供可能购买的商品;社交媒体平台中的兴趣点推荐服务帮助用户发现可能签到的地点;短视频软件中的视频推荐服务为用户提供可能喜欢的短视频;在线音乐网站中的音乐推荐服务帮助用户生成可能喜欢的播放列表—推荐已无处不在。推荐系统的深入研究不仅可以改善用户体验,而且能够帮助企业获取丰厚的商业利润。近年来,伴随互联网技术的蓬勃发展,推荐系统中的数据无论结构上还是形式上均变得更加多样化,以多源性、异构性、多模态性、时序动态性为主要特征的数据发挥着更加重要的作用。如何有效整合日趋复杂多样化的数据是推荐系统研究亟待解决的问题,也是当前机器学习领域的研究趋势。本文针对当前推荐方法在面向多样化数据时存在的局限性,围绕数据长尾性、数据场景感知性、数据异质性和数据时序动态性4个方面展开深入研究,提出相应的解决方案来应对评分预测和物品排序任务。主要研究成果为如下4个方面:1)针对仅从用户角度无法有效优化物品的相对排名问题,提出联合成对排序的推荐方法(co-pairwise ranking,CPR)。首先,依据用户-物品的交互关系和物品-物品的功能互补关系从用户和物品2个角度分别构建正负样本对,提出联合成对排序学习机制来优化目标用户的物品排序列表。对于负样本的选取质量直接影响着模型精度和收敛速度这一问题,进一步提出一种位置感知的采样策略。最后,针对数据不均衡问题,设计一种交替优化算法用于求解CPR方法的目标函数。实验结果表明该方法在物品排序任务上明显优于主流的单值排序和成对排序方法,并验证了联合成对排序学习机制有助于缓解数据的长尾分布效应。2)针对不同物品领域主导用户购买决策因素显著不同的问题,提出融合物品内在与外在特性的推荐方法。首先,细粒度地建模物品的内在与外在特性,进而提出一种内外兼并的概率矩阵分解模型(intrinsic-extrinsic probabilistic matrix factorization,IEPMF)。针对物品属性信息的融入导致传统优化算法效率低下问题,进一步设计一种快速交替最小二乘法求解IEPMF模型参数。最后,为了适应数据实时流入,提供一种在线更新模型参数的机制。实验结果表明IEPMF方法在不同的物品领域其性能均优于主流的推荐方法,并通过案例分析说明联合建模物品内在与外在特性可以获得理想的推荐效果。3)针对如何整合多源异构信息来实现数据价值最大化的问题,提出面向多源异构数据的推荐方法。首先,对多源异构信息中各类数据进行详细定义,并分析物品的2种功能关系与用户评分的相关性。其次,提出一种面向多源异构数据的矩阵分解模型,用于解决推荐系统的评分预测任务。最后,设计一种高效的推荐算法(multi-source heterogeneous information based recommendation algorithm,MSRA)用于求解所提模型的参数。实验结果表明面向多源异构数据的MSRA方法在精度上明显优于主流推荐方法,且该方法能够有效预测目标用户对于不同类型物品的喜好程度。4)针对主流平移模型无法有效建模用户短期偏好的问题,提出面向序列化推荐的高阶平移方法(high-order translation method,HTM)。首先,将所有用户和物品嵌入到一个平移空间中,并在该空间基于高阶时序信息构造一个目标用户相关的平移向量。其次,为了自适应建模不同用户的高阶马尔科夫链,进一步设计一种位置感知的注意力机制用于刻画不同时刻下不同物品对于用户决策的影响。最后,实验结果表明HTM方法在物品排序任务上明显优于主流序列化和非序列化的推荐方法,并通过案例分析验证了位置感知的注意力机制具有较强的可解释性。