论文部分内容阅读
互联网技术的飞速发展,使得人类社会已经进入信息爆炸的大数据时代,从海量的信息数据中快速获取对自己有价值的信息成为研究难题。个性化推荐能够以用户的行为数据为依据,挖掘用户的偏好类型,从而有效地减轻信息过载,提高信息使用率。协同过滤技术是实现个性化推荐的一种成功的算法,该算法对评分数据进行分析,挖掘出用户之间在评分上的相似度,为目标用户或者目标项目找到邻居集,以此来完成推荐。本文针对传统协同过滤因冷启动而无法推荐的问题,提出了两种改进的协同过滤算法,在缺少历史行为记录的情况下,完成对新用户和新项目的推荐。(1)融合用户信息和BP网络的协同过滤算法(Collaborative Filtering Algorithm Combined with User’s Attributes and Back Propagation Network,UA-BP-CF),UA-BP-CF算法首先计算用户间基于特征属性的分量相似度,传入BP网络的输入层,然后经过神经网络加权计算得到输出神经元的值,以此作为衡量新用户相似度的依据,从而解决新用户的冷启动问题,完成推荐。(2)结合项目内容和层次聚类的协同过滤算法(Collaborative Filtering Algorithm Combined with Item’s Contents and Hierarchical Clustering,IC-HC-BP),IC-HC-BP算法分析项目间内容的相关性,根据内容信息计算项目之间的欧氏距离,通过层次聚类的方法,层层聚类,最后找到目标项目的邻居项目,计算预测评分,为新项目进行推荐。本文选用网络开源数据集MovieLens对改进后的算法进行实验验证,为了找到改进算法中参数的最佳取值,设置多组基础实验,对比改进前后的算法推荐性能上是否有提升,分析实验结果发现,本文提出的算法推荐质量更高,可以较好地减轻系统的冷启动问题,提高算法的推荐精度。