基于频繁项集挖掘和用户聚类的协同过滤算法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:c126202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤技术存在数据稀疏性和可扩展性问题,容易导致推荐准确度和推荐效率低下,严重限制推荐技术发展。针对上述问题,本文采用频繁模式挖掘技术和聚类技术对协同过滤算法进行改进。主要研究内容如下:第一、本文结合关联规则算法提出基于频繁项集挖掘的评分填充矩阵方法。通过挖掘项目间潜在关联性,预测未评分项目评分值,用于降低评分矩阵稀疏度和填充误差。经过实验评估,填充后评分矩阵稀疏度相比传统协同过算法降低约7%,评分误差值降低约2%。第二、本文提出基于TF-IDF(词频-逆文本频率指数)与用户聚类的推荐算法。利用TF-IDF算法,得到项目的用户-项目-特征TF值矩阵和TFIDF值。将上述矩阵与用户身份属性信息合并,利用聚类算法划分用户集,并使用特征TF-IDF值改进相似度计算公式,生成推荐列表。经过实验评估,相比传统协同过滤算法而言,计算最近邻集合所需时间降低约一半,推荐结果准确率提高约3%。第三、融合上述两种改进算法,本文提出基于频繁项集挖掘和用户聚类的协同过滤算法,用于同时缓解协同过滤的数据稀疏性和可扩展性问题。对上述两种算法各自得到的近邻集合进行合并处理,选择相似度更高的用户最近邻进行推荐。将所提算法与上述两种算法、传统协同过滤算法、相关文献提出的算法进行比较,在不同情况下本文所提算法均优于以上算法。最后,通过使用本文给出的算法设计了电影推荐系统,该系统能够实现电影推荐、电影搜索、电影详情查询、电影评分等功能,体现了算法的实际应用价值。
其他文献
磁共振成像可以无损地描绘患者体内的结构和功能特征,为当今的医学诊断和研究提供了支持。但是,磁共振成像数据采集速度缓慢导致了非理想的空间分辨率,引起患者不适并阻碍了对时间要求严格的诊断的应用。而快速磁共振成像重建技术可以很好地克服上述缺陷,因此,吸引了众多研究者的关注。深度学习特别是生成模型的快速发展为快速磁共振成像重建技术提供了新的方案,本论文研究基于生成模型的磁共振快速成像重建无监督学习方法。在
在实际生活中存在大量的由数值型和分类型所组成的混合型数据,K-Means算法作为聚类分析算法之一,却只适用对数值型数据挖掘分析,当面对混合型数据时它就显得有些无能为力。经过学者们对混合型数据聚类算法的深入研究,提出了一种可以处理混合型数据的K-Prototypes算法。它具备像K-Means算法一样简单、高效、强伸缩的优点,但也容易受到初始中心点随机选择、聚类数目人为指定、混合属性相异性度量不准确
随着科学技术的进步,图像已经成为人类获取和利用信息的主要方式之一。日常生活中人们对于图像质量的要求也越来越高,不再满足于不模糊的图像,而是追求更高分辨率的图像。虽然人们不断追求更高分辨率的图像,但是现实生活中低分辨率的图像往往更容易获得。现在的图像超分辨率技术可以利用低分辨率的图像得到高分辨率的图像。本文针对的人脸图像超分辨率属于特定应用域的超分辨率技术,可以在其基础上对低分辨率人脸图像完成人脸属
病理切片对临床诊断以及病理学研究有着重要的意义,数字切片的出现提高了病理医生的工作效率,为远程病理诊断以及AI医疗辅诊提供新的研究方向。然而中心化的存储以及医疗隐私泄漏等问题导致切片数据在医疗机构中形成了数据孤岛,阻碍了数字切片技术的进一步发展。区块链技术的发展为医疗数据存储与共享提供了新思路,去中心化、不可篡改、可溯源等优点使其被广泛的使用在数字货币、商品溯源、医疗安全等领域。Hyper Led
随着计算机的处理速度不断提高,信息技术与其相关的业务也呈现爆炸式增长,其中就包括互联网、物联网以及各类信息网。网络技术和多媒体技术在各种应用领域的高速发展,同时刺激了市场对数字产品的需求。但随着数字产品的应用日益增多,信息的非法复制、编辑等问题也是层出不穷。数字水印技术是解决上述问题的有效方法之一,可以有效地应用于数字产品信息的安全防护。数字水印技术通过将需要隐藏的信息嵌入到信息载体中,防止信息在
随着我国城市化建设的逐步完善,降低城市火灾发生率,减少伤亡和损失一直是城市消防建设的重大目标之一。现有的火灾预警系统或智慧消防系统能在火灾发生时及时报警,但尚存诸多不足:(1)系统缺乏大数据技术的支撑,不具备数据集中化管理能力;(2)面对海量的消防数据,缺乏有效的数据挖掘和分析应用;(3)现有火灾预警系统依靠物联网设备实现,缺少火灾预测的应用或预测效果不佳;(4)城市火灾预防采用的消防单位安全风险
随着电子信息化的崛起和科学研究的迭代,人们的生活也在进行着改变,信息的过载已经是目前计算机应用里要面临的重要问题,用户们需要从大量的信息中耗费时间来提取自己所需要的信息。而推荐系统就可以为用户筛选出有效的信息,来解决这个问题。目前协同过滤推荐,混合式的推荐等方法已经在很多互联网平台中得到了应用,为用户来推荐想要的信息。同样的,随着电子商务的迅猛的势头,网上购物行为在人们生活中开始扮演着不可或缺的角
现如今,利用信息系统进行业务和数据管理已是日常办公的主要手段。然而,随着对系统的不断使用以及用户的不断增加,大并发和海量数据带来的性能瓶颈日益突显,因版本迭代导致的模块更新也越来越频繁。如何能在大数据、高并发的情况下保证业务系统的高效运行,以及如何在模块迭代过程中保证其它业务模块正常运行,是当下行业信息化系统亟待解决的两大应用痛点。本文所设计的管理信息系统(MIS)通用框架,从软件的可复用性角度出
图像语义分割是计算机视觉领域的主要任务之一,其目的是对图像中的每个像素点进行分类,预测像素点对应的语义标签。随着深度学习研究的不断深入,基于卷积神经网络的语义分割算法通过多层级联的复杂结构直接从图像中提取更具有表达能力的目标特征信息,提高了分割的精度。为了更有效提取图像的特征信息以增强分割效果,本文基于深度学习技术,从高效利用卷积神经网络各层级特征信息的角度出发,对多层特征融合的语义分割算法进行研
知识图谱生成中所使用的数据存在来源不同、类型多样、利用率低等特征,这些特征易造成多源数据难表征问题和知识图谱检索效率低问题。针对上述问题,迫切需要多源异构数据有效表征及检索优化方法。本文面向多源异构文本数据表征及检索优化方法展开研究,主要工作如下:第一、本文通过研究多源数据、知识图谱和图检索技术,探究三者间的关联,揭示了知识图谱中的多源数据图表征问题以及图表征下多源数据快速检索问题,并就相关问题的