论文部分内容阅读
互联网时代,伴随电子商务网站与社交媒体平台的飞速发展,用户、商品、评论等各类信息呈爆炸式增长。面对海量、复杂信息,用户高效获取有用信息变得更加困难,信息过载问题日益突出。为了有效缓解信息过载问题,个性化推荐技术应运而生。该技术通过分析用户的历史行为信息及其相关偏好,将可能会被用户喜欢的产品、信息或服务推荐给用户,在提升用户信息获取效率的同时,增强了用户黏性,促进了相关利益主体的业绩提升。协同过滤推荐方法作为应用最广泛的个性化推荐技术之一,受到学术界与产业界的重点关注。从现有研究进展来看,尽管协同过滤推荐技术取得了系列有价值的研究成果,但数据稀疏、用户兴趣漂移等难题仍然制约着其推荐性能的提升。本文面向数据稀疏、用户兴趣漂移等难题,以用户兴趣的深入分析为切入,通过融合用户的项目属性偏好与兴趣变化信息,综合运用非线性遗忘函数、k-means聚类等方法,建立了基于用户兴趣建模的协同过滤推荐算法。主要的研究成果如下:(1)面向数据稀疏问题,着眼于更为细致的考虑用户兴趣,本文基于用户评分信息与项目属性信息的融合,将用户-项目评分矩阵转化为用户-项目属性偏好矩阵,降低了矩阵的稀疏程度。(2)面向用户兴趣漂移问题,以艾宾浩斯遗忘曲线为理论基础,本文引入不同年龄段的非线性遗忘函数,更细致地刻画用户的兴趣变化,为优化最近邻居集的相似性计算提供支撑。(3)基于用户的项目属性偏好向量,运用k-means聚类算法对用户进行分类,通过在类内寻找目标用户的最近邻,给出相应地最近邻居集获取方法,进而提出本文的推荐生成准则。在此基础上,本文从MovieLens网站ml-100k公开数据集中随机抽取100个用户对1682部电影的11249条评分数据作为实验数据基础,通过6组比较实验验证了本文方法的有效性与稳定性。总体来看,本文围绕用户兴趣更为细致的刻画,开展了协同过滤推荐方法的研究。研究成果对于应对推荐系统中的数据稀疏、用户兴趣漂移难题具有一定的理论价值,在电商网站等个性化推荐领域具有较好的应用价值。