论文部分内容阅读
随着信息量爆炸式的增加,伴随而来的是无关信息大量充斥在用户身边,用户无法方便地获取自己所需要的信息,因此在用户身边越来越频繁地见到推荐系统的影子。推荐系统对于向特定用户提供特定内容,排除其他不适合用户的信息起到了十分积极的作用。对于评判一个推荐系统来说,最为关键的评价指标包括推荐系统的推荐是否准确,该推荐系统所消耗的资源以及时间是否很少。为了达成这三个目标,众多研究者参与其中,基于不同的环境提出了很多解决思路和方向,其中隐语义模型就是这几年比较热门的方向。本文对于隐语义模型在推荐系统方面存在的问题以及如何解决进行了研究。本文的主要贡献如下:1、对推荐系统中隐语义模型的研究现状进行了综述。本文详细介绍了推荐系统以及常见的推荐系统模型的基本概念,分析了推荐系统中的隐语义模型及现有改进了隐语义模型的一些方案,并对其中经常使用到的主题模型进行了深入分析。2、为了解决之前存在的的直接通过个人的经验来确定主题模型中的主题数量的问题,使用了一种主成分分析的方法来确定主题模型中的主题数量,之后我们也通过结果证实了该方法得到的主题数量的正确性。3、为了解决隐语义模型中潜在因子的内无法定义容的问题,使用了主题模型从用户对物品的评论信息中提取出了隐藏的主题信息以及相关的主题参数,并提出了一种偏好扩散方法,该方法可以通过用户对于物品的打分来对各个物品的主题参数进行修正,以得到更加精确的结果。4、本文提出了一种带有时间参数的主题引导线性回归模型,通过将模型中物品的属性分布矩阵进行初始化,并在模型中加入了时间参数进行修正,利用用户,物品,时间参数之间的相互耦合对这些参数进行更新。该模型预测结果的准确度领先于现有的基于隐语义模型的推荐系统模型。5、针对在梯度下降过程中耗费时间过慢的情况,并解决过去的多线程并行方法中存在的问题,使用全新的多线程并行方法进行计算,从而大大降低了新模型在梯度下降过程中所耗费的时间。