基于用户属性聚类的协同过滤推荐算法研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:smn1970
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤作为一种经典的个性化推荐技术,已成功应用于众多领域中,并取得了长足的进展。随着云计算、物联网等技术的迅速发展,信息的增长速度远远超出了我们处理信息的能力。信息过载问题日益突出,尤其是在未来数据量会达到ZB的情况下,协同过滤推荐技术的三大问题:可扩展性、冷启动、数据稀疏性将会受到愈来愈严峻的挑战。针对协同过滤推荐算法面对的扩展性以及冷启动问题,对协同过滤相似度模型进行优化,提出了基于优化的K-means方法的PCEDS相似度模型,来提高推荐质量。随着聚类技术的快速发展,聚类算法也逐步走向成熟,其中K-means方法是比较有代表性且易实现的一类聚类算法。针对协同过滤推荐算法的可扩展性问题,提出了基于用户属性特征信息的K-means聚类的协同过滤推荐算法。由于K-means方法对选取的初始聚类中心具有敏感性,本文对K-means方法进行了优化,即基于用户活跃度(CF-act)选取初始聚类中心。在优化之前,本文首先对用户属性特征信息进行了数据分析以及数据处理。针对协同过滤推荐算法的冷启动问题,本文提出了融合用户属性特征相似度和用户偏好相似度的协同过滤推荐算法。由于对用户属性特征信息进行了预处理,所以,本文提出了基于信任度的用户属性特征相似度模型,将基于信任度的用户属性特征和用户偏好的相似度模型相结合,提出了PCEDS相似度模型对聚类结果建立预测模型。实验结果表明,提出的PCEDS相似度模型比传统的协同过滤推荐算法在均方根误差(RMSE)上有明显降低,并且在推荐准确率(Precision)和召回率(Recall)均有明显提高,缓解了冷启动问题,同时聚类技术可以减少系统运行空间,缩短了推荐时间。
其他文献
数学作为人们生活中不可或缺、常常伴随左右的,是生活的依仗,所以为学生未来的生活,我国教育部门一直把数学教育看得很重。如何让学生更好更快地理解、掌握,就是我们必要讨论
随着网络技术和计算机技术的快速发展,信息化已经成为影响社会各行各业的重要因素,特别是不断成熟的电子政务系统,受到了很多部门的亲睐,也给他们的实际工作带来了显著的效果
目的:进一步了解颌骨肿瘤瘤样病变的临床表现,探讨良性肿瘤及瘤样病变与恶性肿瘤在CT中表现的差异。方法:将收治的颌骨肿瘤患者及瘤样病变患者的临床资料进行整理并进行回顾
罗伯茨绿僵菌Metarhizium robertsii(以下简称绿僵菌)是一种广泛用于生物防治的昆虫病原真菌,且为研究虫生真菌的模式种。生物生长发育过程都会受到表观遗传修饰的影响,同时,表
南京信息工程大学开发的“多普勒天气雷达二次产品”处理系统,具有可以兼容多种雷达数据格式、二次产品丰富,可扩展性和易用性等特点。随着多普勒雷达在我国的广泛应用,对雷
为了解青藏和云贵高原轮虫种类多样性和群落结构,探讨该地区湖泊轮虫种类多样性和群落结构的影响因子,于2012年和2013年6至8月对青藏高原地区42个湖泊和38个临时性水体,以及云贵
《勒俄特依》以神话和实际事物相结合的艺术手法,说明天地的形成、万物的生长、山河的来源、人类社会的发生、发展和演变以及彝族的社会变迁和迁徙等。其进化演变不仅反映了
环境创新是出版产业应对环境变化和实现可持续发展的重要手段,也是出版产业为建设美丽中国作出贡献的重要手段。本研究从需求拉动要素、技术推动要素和环境规制要素三个视角
随着时代的不断发展,科学技术也得到了很大的进步,尤其是公安系统对于打击罪犯,运用的科学手段和技术也越来越智能化、科学化。可以说,现代化的信息技术的使用,能够为公安部
近年来,随着“双一流”建设政策的实施,十九大的召开,第四轮学科评估的启动以及高等教育国际化程度的日益提高。我国大学进一步明确学科建设在大学建设中的基础意义,纷纷参与