基于用户喜好类型的协同过滤推荐算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:Jssw3_4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和服务的迅速发展,我们所生存的信息数据世界得到了快速的膨胀。然而,信息的快速膨胀带来了很多的问题,其中“信息迷航”和“信息超载”的问题越来越严重。解决这两个问题的方法可以分为以下两种:信息检索和信息过滤。信息检索是根据信息用户的需要,从按一定方式组织和存储起来的信息中,查找出相关的信息的过程和技术。信息过滤则是根据用户提供的过滤需求,从动态的信息流中将满足用户兴趣的个性化需求信息自动地挑选出来。信息过滤技术的一种重要的应用方式是推荐技术。推荐技术在电子商务领域得到了越来越广泛的应用,也得到了越来越多的研究者的关注。本文的研究对象正是推荐技术。虽然推荐技术已经发展了几十年,但是还没有达到完全成熟地步。现在的推荐系统所面临的主要挑战有精确度不高,伸缩性和实时性低,以及数据稀疏度高等问题。电子商务推荐技术的研究方向主要包括基于内容的过滤推荐和协同过程过滤推荐。另外,还有一些常用的推荐技术如基于关联规则的推荐算法、基于聚类推荐算法。本文较为详细地介绍了这些算法以及他们各自的优缺点。文章详细介绍了推荐技术中的协同过滤推荐算法。协同过滤推荐算法基于用户的评分记录,依据目标用户的最近邻,向目标用户推荐相似的商品项目。我们详细地分析了传统的协同过滤推荐算法的局限性。比如,当利用传统的相似度计算方法中的余弦相似度方法或相关系数相似度方法去处理用户评分表中的Null值时,推荐结果的正确性将会受到损害。针对Null值的处理问题,我们基于特征组合(Feature Combination)的思想,提出了基于项目协同推荐算法的Null值缺省值预测方法。另外,针对传统协同过滤推荐算法中数据的高稀疏度和低准确度问题,本文提出了基于用户喜好类型的用户评分表划分方法。该方法有效地减少了计算项目的空间,提高了推荐的准确度以及推荐系统的运行效率。之后,我们从实际生活和实验数据的角度,详细分析了这两种算法的可行性、有效性以及各自存在的问题。基于Null值缺省预测法和用户喜好类型划分法,我们提出了基于用户喜好类型的协同过滤推荐算法(User Favorite Type Based, UFTB)。同时,我们也从实验角度分析了UFTB算法的可行性和有效性,以及此算法所面临的主要问题。本文的实验部分首先针对我们提出的Null值缺省预测法和用户喜好类型划分法,进行了先独立再综合的分析和验证。我们先将用户喜好类型划分法应用在传统的协同过滤推荐算法中,并将其预测结果与传统算法的预测结果做比较。再将Null值缺省预测法应用在传统的协同过滤推荐算法中,并将其预测结果与传统的推荐算法的预测结果做以对比。最后,我们实验证明了UFTB算法的有效性。
其他文献
本文通过对荣华二采区10
期刊
国内外中低压配电网的中性点接地方式普遍为小电流接地方式,该接地方式发生单相接地故障时,故障电流小,不会立即引起开关跳闸,可以继续为负荷供电1~2h,供电可靠性高。但随着
根据中央政府工作报告和经济形势可以看出,我国经济发展进入新常态,作为传统产业的煤炭工业也面临着转型升级。2016年2月1日,国务院发布《关于煤炭行业化解过剩产能实现脱困
风能作为可再生的清洁能源,具有无污染、能量大、分布广泛的优点。而风力发电又是风能利用的主要形式,也是大规模开发的发电方式之一。随着国际能源危机的出现,风力发电已经
低频振荡通常被归结为小扰动稳定问题,将系统的非线性微分方程在平衡点附近线性化,获取线性化方程的机电相关特征根反映系统的振荡模式和模态。特征根分析只能表征系统在平衡点
随着计算机网络技术和数字多媒体技术的飞速发展,信息的发布和传输越来越趋于数字化和网络化,数字信息变得越来越容易获取和存储,信息传输和交流也变得方便而快捷,但同时也引
在我国,能源问题一直是备受关注的问题,而能源使用效率低下是能源问题的一个主要原因。电动机行业也不例外,据统计,目前我国各类电动机总装机容量为4.2亿KW,耗电10000亿KWh以上,占每年电力消耗的比例达到60%以上。可以想象,如果电机效率每提高1%,就可节省100亿KWh以上的电能。而当今社会,各种新型电机不断的出现在市场上,均称其能效比很高,但这些电机的能效提高的程度有多大,得需要电机行业的专
近年来,我国电力系统飞速发展,随着西电东送、全国联网的实施,电网规模越来越大。电网区域间存在弱互联,再加上快速励磁系统的大量投入,导致系统整体阻尼作用减弱。在扰动下