论文部分内容阅读
随着互联网技术的高速发展,人们已经步入了 Web2.0时代,信息的爆炸式增长使用户获得所需信息变得更加困难,这无疑造成了严重的信息过载问题。在这种情况下,个性化推荐技术作为一种解决该问题的有效手段应运而生,该技术以信息过滤和信息检索为基础,主动地将有用的信息推荐给用户。在众多的推荐技术中,协同过滤技术凭借其优势已经成为了推荐系统中应用最广泛的方法,但仍然存在一些关键问题制约着其进一步地发展。本文以基于协同过滤技术的推荐系统作为重点研究对象,针对其中存在的用户兴趣时效性问题及数据稀疏与系统可扩展性问题进行了研究,本文主要工作包括:首先,针对用户兴趣的时效性问题,提出了基于标签且融合用户近期与长期兴趣的推荐算法。该算法可以很好地平衡用户的近期和长期行为规律,从而保证了对用户兴趣预测的多样性及延续性。首先,从用户标签角度出发构建用户基于标签的近期与长期兴趣特征;然后,将此特征映射到用户标注过的资源上,形成用户-资源伪评分矩阵;最后以此矩阵计算用户最近邻集合,做出推荐。其次,针对协同过滤推荐系统中的数据稀疏和可扩展性问题,提出了一种基于KPCA降维和改进K-means聚类的优化推荐算法。首先,引入核主成分分析(KPCA)方法对用户-资源评分矩阵进行降维;然后,针对传统皮尔森相似度计算方法准确度不高的缺点,引入了修正因子对相似度计算方法进行优化;最后,将改进的相似度应用到K-Means算法对降维后的用户数据聚类,在目标用户所处的类中寻找最近邻,做出推荐。最后,利用公开数据集对优化的协同过滤推荐算法进行性能评估,通过与其他推荐算法的对比结果可以发现,本文提出的两种优化算法分别缓解了协同过滤推荐中存在的用户兴趣时效性问题以及数据稀疏与系统可扩展问题,使推荐质量得到了一定程度地提高。