基于相关系数的协同过滤算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:zhenlijinping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤算法由于简洁的设计思想和优越的计算性能,一直是推荐算法研究领域中的一个热点。随着研究工作的不断深入,如何缓解协同过滤算法的稀疏性与扩展性问题,正逐渐成为人们关注的焦点。有鉴于此,本文首先总结了近年来协同过滤算法的相关研究成果,特别对基于内存和基于模型两种分类情况的研究内容进行了分析;其次,在重点分析协同过滤算法稀疏性问题的基础上,对其中影响算法性能的一些关键环节进行了不同程度的改进,进而给出了一种基于相关系数的协同过滤算法模型;最后,通过仿真实验,对改进后的计算模型进行了测试与分析,进一步阐释了计算模型在处理相关问题的可行性与有效性。  论文通过对一些主要协同过滤算法模型的分析,凝练出当前经典协同过滤算法的一般性架构,并以此为算法设计的基本框架。再通过将语义相似度和权重近似度两种计算过程的有机结合,构造出一种基于相关系数的、计算效率相对较高、新型的协同过滤算法。具体而言,算法借助社会化标签的概念,将项目间语义相似度计算引入到协同过滤算法中,使得语义相似度计算参与到未知项评分的计算过程中,从而降低了协同过滤算法对评分矩阵的依赖性,最终达到缓解稀疏性问题的目的。另一方面,为了确保算法具有良好的容错性和较高的推荐个性化程度,算法在设计方面充分利用了用户评分信息来计算项目间权重的近似度。其中,语义相似度是项目间本质属性关联程度的数值化表示;权重近似度是项目间基于用户评分的相似程度的数值化表示。在此前提下,项目相关系数模型可看成是上述两种计算过程相结合的产物,即当该模型执行结束后,未知项评分也随之计算得出,进而可使用Top-N算法为任意用户计算推荐列表。  在模型的应用研究方面,本文着重探讨了基于相关系数的协同过滤推荐系统的一种具体实现方式,并对其应用系统的组织结构进行了分析。性能分析采用了两类评价标准,即平均绝对误差法(MAE)和命中率(HR);分析内容主要涉及三个方面,即(1)验证调节参数α的最优值,(2)与经典协同过滤算法的性能进行比较,(3)评分稀疏程度变化对算法性能的影响。通过仿真实验,进一步验证了算法的性能与经典协同过滤算法相比具有一定的优势。  
其他文献
一直以来计算模型的不断演化,根本原因是计算机软件和硬件技术的快速发展。云计算模型就是在这种技术背景下产生的,它采用创新的计算模式,使用户可以自由获得计算、存储服务,并按
随着科技的飞速发展和进步,每日的大宗市场交易、股票期货金融领域、医疗行业积累了大量的数据,如何利用这些数据,在海量数据库基础上,纵向挖掘出有价值的信息成为研究热点。相应
通过对无线传感器网络(WSN)路由的研究与分析,引入k-平均聚类算法对节点进行分簇。该分簇算法可以使每个簇中节点到达簇头节点的距离之和为最小,有利于减少网络节点能量的消
随着互联网技术的发展,智能设备的普及,人们可以随时随地采集并以文本、音频、视频、图像等其他载体形式记录和分享信息,带来了多媒体信息的迅速膨胀,同时计算机可读的音乐学科知
科学研究早已发现,情感在学习、感知、理性决策以及其他的认知行为中,有着非常重要的影响。情感不只限于艺术、娱乐和社交,还影响着理性思维的根本机制。当前,人工智能的研究
随着物联网的快速发展,作为物联网的关键组成部分,无线网络承担着越来越高的业务要求。人们开始要求无线网络能够处理更多的实时业务,例如视频会议,视频多播,VoIP,网络游戏等日常业
随着微电子技术的快速发展,大量的嵌入式产品进入到百姓的生活之中,高效的开发产品具有成本低、体积小、功耗低的特点。软硬件协同设计是软硬件划分的主流方法,这种方法避免了传
随着计算机技术的飞速发展,无线传感器网络技术也日益成熟,基于无线传感网络技术的智能控制系统的应用也越来越广泛,这给高校信息化建设提供了新的思路。高校教室因其特有的功能
随着计算机技术、通信技术和网络技术的迅猛发展,互联网已成为人们获取信息的一种重要途径。网络大数据背景下,互联网中文本数据的数量和价值呈指数增长,复制网络中文本的现象越
随着网络技术的日益发展,网络系统的安全性和可靠性已经成为网络用户所关注的焦点,对于校园网而言,由于用户数量大,安全隐患多,网络安全也越来越受到学校的重视。传统的网络安全防