论文部分内容阅读
随着科学技术与互联网技术的发展,尤其移动互联网的普及,网络中产生了越来越多的信息。通过对这些信息的分析与利用,衍生出很多应用,极大的提高了人们的生活水平。但同时由于数据增长速度过快产生了信息过载问题,推荐系统作为解决信息过载的工具发挥了重要的作用。协同过滤算法是当前应用最为广泛的推荐算法,其主要是利用用户对商品的评分信息计算用户之间的相似度,利用相似好友感兴趣的商品对用户进行推荐。然而当缺乏用户对商品的评分信息时,这种方法就显得无能为力,且在真实环境中更普遍存在的是用户对商品的隐式反馈行为,针对此情况本文考虑使用隐式反馈信息,即利用用户对商品的历史访问信息来预测用户可能感兴趣的商品。除此之外协同过滤算法存在着数据稀疏与冷启动等问题,极大地降低了推荐性能。为了帮助解决这些问题,有学者提出结合用户的社会化信息进行推荐。但是当前学者们将注意力集中在探索用户的影响力以及如何利用用户之间的信任关系,这没有充分发挥用户的社会网络中所蕴含的如共同兴趣等信息。针对这种情况,本文在用户喜爱偏好的基础上充分考虑了用户的社会化特点,即与用户归属相同兴趣社区的好友关系,充分利用用户的社会网络信息不但能缓解冷启动问题而且能够提升推荐性能。同时,本文在此基础上考虑到了用户的时间性行为。在通常情况下,用户的行为受时间上下文因素的影响而存在着经常性及时间相关性,然而绝大多数传统的协同过滤算法并没有考虑到这一点,但是这对于针对不同时间向用户推荐适合的商品是非常必要的。本文提出了基于泊松张量分解的社会化推荐方法(SPTD,Social Recommendation Algorithm Based on Poisson Tensor Decomposition)。这是一种概率模型,其不但能够有效利用用户的社会化信息,且为如何将用户的社会化信息与具有时间特征的用户偏好相结合提供了新思路,算法能够利用用户隐式反馈的历史行为数据与用户的社会关系数据对用户在某时间上可能感兴趣的商品进行预测并推荐。SPTD算法是基于泊松分解模型的概率模型,在模型的求解过程中,模型仅仅需要使用数据集中正项的隐式反馈数据进行迭代,计算效率高。与传统的分解模型相比较,泊松分解模型能抓住数据的稀疏特征,在稀疏数据上具有更优秀的推荐效果,且容易扩展到海量数据集。因此,本文的工作主要如下:(1)利用用户的特征信息与用户对商品的历史访问数据计算用户间的兴趣相似度,根据兴趣相似度计算用户所属的兴趣社区,挑选与用户同属相同兴趣社区的好友帮助提升推荐效果。(2)针对在现实情况中用户对商品的显示打分反馈较少的情况,本文利用用户对商品的隐式反馈数据进行推荐。(3)考虑到了用户的时间性行为,因此本文提出一种结合用户时间性行为的模型,该模型能够表现出用户在不同时间上的兴趣偏好。(4)本文提出如何将用户的时间相关的兴趣偏好与社会化信息相结合,为如何充分利用二者所提供信息进行有效推荐提供了新思路。最后通过在两个真实数据集中进行实验,证实本文所提出的SPTD算法具有更好的推荐能力,且具有较好的计算效率。