基于改进模糊聚类的WFSLIM推荐算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:phlok1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,人们已经从PC时代进入了以智能手机为代表的移动互联网联网时代,目前人类每天产生的数据量呈指数在增长。也有人称21世纪是数据的时代(DT)。移动互联网产生巨大数据的同时也极大的促进了微博,推特,淘宝等社交和电商网络的火热发展。根据CNNIC报道,截至2016年底,中国网民总数已达7.1亿。如此庞大的互联网用户伴随而来的是庞大的数据。面对浩渺的数据如何利用用户产生的行为数据来进行高效,经济的个性化推荐成了各大平台重要的研究问题。目前无论微博等社交网络或者淘宝等电子商务网站现有的推荐系统效果往往都是不太尽如人意。社交和电商的推荐系统主要集中在Top-N的推荐问题研究上。好的自动化推荐系统可以极大提高用户在平台的活跃度和平台收益。本文通过介绍各种传统推荐算法和其不足之处,比如QQ的基于用户的协同过滤算法就曾出现将前女友推荐给现女友的笑话。当然这些缺点还包括推荐准确率不高,数据稀疏,运算量庞大等问题。提出用基于密度距离加权的WDFCM聚类算法对用户聚类,然后采用综合考虑用户之间,项目之间的相关系数的WFSLIM推荐算法进行推荐,本文主要工作如下:(1)很多电商和社交平台的推荐系统主要采用基于模型的协同过滤算法。此算法往往存在着数据稀疏性,系统可扩展性差以及冷启动等问题。基于SVD的推荐算法只是简单的对评分矩阵进行数学上的矩阵分解,这仅仅是用户和商品之间的直接关系。并没有全面考虑到用户之间,项目之间对预测的影响,对矩阵分解产生的因子矩阵也没有过多的考虑他们所处在推荐系统的真实意义。(2)FCM模糊聚类算法在处理一些特定场景时,其实验结果的效果很大取决于聚类参数和中心点的选取,本文综合考虑了模糊聚类样本点的距离和密度对聚类准确度的影响,提出了WDFCM算法,通过实验验证了算法针对一些数据集,聚类准确度有了显著的提高并且减少了聚类的迭代次数。(3)本文将基于模型的推荐算法隐语义模型进行了拓展,并在拓展模型中考虑了用户之间,用户与用户集之间以及项目之间的相关系数,针对传统的推荐算法准确率低,数据稀疏问题,本文提出了先将用户进行改进的WDFCM聚类,综合考虑用户,用户集以及项目之间的相关系数对评分矩阵的影响,然后采用改进的WFSLIM推荐算法进行推荐。从而达到降低了评分矩阵的稀疏度并且提高了模型推荐的准确率。同时也在一定条件下降低了算法的运行时间。(4)随着电子商务网站的用户和物品数据的飞速增加,传统的推荐算法平台在处理海量数据时已经明显性能不足,本文最后在基于Hadoop大数据平台上,实现了推荐系统算法的设计和开发。
其他文献
根据高性能计算和高通量计算的概念,结合当前复杂仿真系统的应用特点,给出了高通量仿真的定义。高通量仿真指的是利用大量的计算资源,在较长的时间内,以较高的运算效率完成大
广义频分复用(GFDM)是一种灵活的数字多载波调制方案,它的灵活性可以满足未来网络的多样化应用需求。多输入多输出(MIMO)技术可以在不增加天线发射功率和系统带宽的情况下提
随着惯性导航技术的快速发展,对基于惯性导航装置数据采集系统的精度和数据处理吞吐量要求越来越高,性能优良的数据采集系统备受惯性导航技术工作者的欢迎,为了提高系统的高
背景黑色素瘤(Malignant melanoma,MM),是来源于神经嵴黑色素细胞的高度恶性肿瘤,常见于皮肤和其他器官黏膜,早期即可发生局部和远处转移,恶性程度高,进展迅速,总体中位生存
随着3D电影《阿凡达》在国内外掀起的热浪,3D技术的发展迅速地成为业界关注的重点。3D获取可以通过直接拍摄,也可以通过一些后期处理技术生成新的虚拟视点。在立体显示中,更
互联网以其丰富的海量资源且规模日益增长的、开放的特性,成为各个行业以及各种信息系统重要的信息来源。如何从这个巨大的信息资源库中准确地获取有价值的信息,成为各种信息
随着嵌入式系统在工业和家庭的各个领域的广泛应用,对具有高速和实时数据存储能力的存储设备的需求也越来越多。基于嵌入式系统的数据的存储和管理逐渐成为当今的一个急需研
随着航天、国防、医学等领域的发展以及纳米技术的不断提高,零件的尺寸越来越小,微纳物体的表面参数分析已成为精密测量领域不可或缺的研究方向。2011年科技部启动了国家重大
纳米电子器件和技术是解决传统半导体工艺技术瓶颈的途径之一。共振隧穿二极管(RTD)作为较成熟的纳米电子器件,在高速低功耗的数字电路领域应用广泛。由RTD构成的单双稳态转
随着企业自主创新能力的不断增强,与之相关的R&D信息也日益增多。作为企业的战略性信息之一,R&D信息已然成为资本市场上价值评估的一项重要内容。2006年,财政部颁布的新企业