基于社交网络的协同过滤推荐算法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:wgguihuake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的快速发展,互联网给人们的工作生活都带来了很多的便利。例如,在过去人们为了买一件衣服,可能需要去很远的商场购买,而如今,只需要通过网络在淘宝,京东等电商网站在线购买即可,省时省力。然而,当海量的商品信息充斥于互联网中时,人们面临着严重的信息过载问题。为了帮助用户更轻松更快速的寻找到所需要的商品,推荐系统应运而生,并被广泛的应用于诸如亚马逊,Netflix等网站。在诸多推荐算法当中,协同过滤算法由于只需要评分信息而且实现技术难度不大,成为最流行最成功的推荐算法之一。但是,它依然面临着数据稀疏性,可扩展性差的问题,一定程度上限制了推荐系统的预测推荐能力。近年来社交网站发展迅速,传统的电子商务网站也加入了用户社交的功能,为用户提供了评论,交流,反馈的能力,并产生了海量的社交网络信息,为解决传统协同过滤算法所面临的难题提供了新的思路和途径。基于以上分析,本文通过引入用户社交网络信息提出了两种新的协同过滤算法,具体内容如下:(1)为了解决数据稀疏性问题,本文分别在物品相似度计算和评分预测阶段,利用社交网络中朋友关系信息对评分矩阵中的缺失值进行选择性地填充,使得评分矩阵中的已有信息利用最大化,进而提出了基于社交网络缺失值填充的协同过滤推荐算法。最后,在公开数据集上进行了相关实验,结果表明提出的方法在数据稀疏的情况下,仍然有着很好的推荐精度。(2)为了解决可扩展性问题,本文对用户的社交网络进行社区发现,找到各个社区对应的物品集合,将物品划分为若干个物品组,然后构建出一个低维稠密的物品隶属度矩阵来代替传统协同过滤中高维稀疏的评分矩阵,进而在该隶属度矩阵上计算物品相似度,进行基于物品的协同过滤算法。最后,在公开数据集上进行了相关实验,结果表明与其他方法相比提出的方法在保证推荐准确性的同时明显提升了计算效率。本文提出的两种算法极大的改善了传统协同过滤算法的性能,使得推荐系统面对大数量的用户和物品的真实环境中的应用能力更强,将信息精准的推送给需要它的用户,提高人们的互联网体验。
其他文献
随着网络技术的快速发展,网络业务不仅包括传统的数据业务,还包括语音、视频等多媒体业务。多媒体业务要求网络提供很高的带宽,低时延和低抖动等。为满足新型网络业务的服务
无线多媒体传感器网络是在传统的传感器网络的基础上发展而来的,引入了多媒体信息的感知内容(如视频、音频等),具有更强的感知能力。但是,传感器节点资源(能量、带宽等)有限,而多
随着Internet的迅速发展,大数据时代已悄无声息地到来,数据的规模较之过去已呈现出井喷式的增长态势,同时数据结构亦愈发复杂多变。在这样的情势下,由于传统的数据分析方法在
由于互联网技术的不断进步与各类电子终端的迅速普及,我们获取资讯的方式发生了重大的改变,网络信息已经成为社会中各种信息的重要载体。其中,新闻视频以其丰富、直观表达方式成
随着网络、通信和计算机技术的迅速发展,数据挖掘呈现出数据海量化,分布式挖掘等特点,如何在挖掘过程中保护隐私数据和防止敏感信息泄露已成为当前面临的重大挑战,隐私保护数
高压输电线路绝缘子发生闪络往往导致长时间大面积的停电事故,对国民经济造成巨大损害,因此对输电线路上绝缘子发生闪络的监测及预防意义重大,而对绝缘子闪络监测及预防的基础工作就是对绝缘子泄漏电流进行数据分析。本文首先对EMD算法进行了改进,用改进后的EMD算法对绝缘子泄漏电流数据进行了分解,并用小波阈值去噪方法对分解后的数值进行去噪,然后对去噪后的数据进行Hilbert变换得到其时频谱及边际能量谱,最后
表情识别是一项很富挑战性的工作;而且由于它在很多实际应用方面(人机交互、医疗行业、心理学等)都很有应用前景,所以这项工作也相当具有吸引力。以前大部分的研究都是针对于
随着嵌入式系统应用领域的不断扩展,诸如手持式智能终端等嵌入式设备接入Internet已成为技术主流。嵌入式Internet技术面临的主要困难是标准Internet协议对于计算机存储器容
云计算作为一种可以提供高性能计算、管理和服务的信息新技术,它能够以较低成本和较高性能解决海量信息存储和大规模计算问题,从而能较好的解决许多企业发展过程中的IT设备更新
随着地理信息系统的普及,越来越多的用户希望在线获取空间服务和空间数据。空间信息在线服务面临着许多挑战:海量空间数据的网络传输导致传输速度缓慢;大量并发用户的请求致使服