基于用户兴趣的协同过滤推荐算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:dlfb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网技术的快速发展,推荐系统由于能够帮助用户快速做出适当决定,被广泛应用于各大电子商务网站,推荐服务的使用能促进用户由浏览者到购买者之间的转换,给生产商带来商机的同时让用户信息生活更加智能高效。协作过滤(CF)是作为推荐领域的主要技术,能够行之有效地解决信息超载问题。协同过滤根据用户更易采纳与其志同道合的朋友给出的推荐这一思想,采用最近邻技术研究用户兴趣特征,通过预测用户兴趣进行个性化推荐。在用户-项目矩阵中,评分数据量与用户项目数比较相当稀疏,导致推荐采纳率下降,用户使用体验不理想。此外,协同过滤还存在冷启动,扩展性差和未考虑用户兴趣动态变化等问题,导致推荐结果的准确率低。因此,我们还需要针对上述问题进行进一步研究。本文具体的工作如下:(1)基于邻域的协同过滤算法在进行相似性度量时只利用用户间共同评分,而数据集中用户有效数据短缺和项目规模庞大,导致用户-项目矩阵稀疏性严重,相似性度量与实际存在偏差,推荐效果并不理想。因此,本文提出一种基于巴氏系数和Jaccard系数的协同过滤算法。在项目相似性度量中,该算法引入巴氏系数和Jaccard系数,巴氏系数能够利用用户所有评分信息能够克服共同评分的限制,提高用户有效信息的利用率;Jaccard系数可以增加相似性度量中共同评分项所占的比重,调整巴氏系数使用全局用户数据信息而忽略了共同评分项对相似性度量的重要性;最后同时利用两个系数提高相似性度量准确率。通过实验验证,该算法通过提高项目相似度准确率来选取最近邻,优化了对目标用户的偏好预测和个性化推荐。(2)基于用户的协同过滤在进行推荐时,侧重于如何高效利用历史评分数据来计算似度,忽略了评分数据的时效性问题。本文考虑时间因素对推荐的影响,针对某个时刻用户喜好突然发生变化导致用户历史数据失真,用户进行聚类的时刻存在随机性和评分预测与实际数据差距大的问题,提出用户兴趣偏移和聚类的推荐算法。首先,引入项目关联相似度和项目关联图,项目关联相似度考虑项目隐形属性提高相似度准确率,项目关联图将项目聚合分类,缩短推荐列表生成的时间;然后根据关联图建立兴趣模型对用户兴趣类别进行分类,利用序列隔断算法辨别用户兴趣随时间的变化,对某时刻兴趣发生偏移的用户仅保留这个时刻后的历史数据用于算法运算;最后利用近邻集进行预测推荐。实验分别从聚类和推荐两方面进行,经验证该算法能够提高聚类和推荐的准确率。
其他文献
软件需求描述(如场景)中存在的细节过多、缺乏结构性、不规范、不一致等问题,为后续的软件开发活动带来困难,需求分析是解决上述问题的有效途径。过程建模是目前项目实践中使用较
在广播电视系统中,出于对传统电视兼容和传输带宽成本的考虑,电视信号在传输过程中在将来很长一段时间仍将采用隔行扫描格式。对高清晰度数字电视(HDTV)而言,它们的显示系统只支持
近年来,由于经济的快速发展和计算机科技的普遍应用,应用在户外的监控系统对图像处理技术的要求也越来越高。但是环境问题的日益突出给这些技术的应用带来了挑战,尤其是当前
随着数据收集工具的广泛应用,海量数据的收集和积累导致“数据爆炸”,已经超出了人们理解和掌握的能力,传统的数据分析方法已不能满足需求,数据挖掘和知识发现技术应运而生并得到
近年来,跟随全球信息化建设的浪潮,Web应用系统(基于浏览器和后端服务器)已经逐渐替换原有的传统信息系统(基于客户端和后端服务器)成为当令信息系统架构和构建中最流行的方式。Web
学位
随着医学领域影像数字化进程的推进,医学影像成像技术和设备不断发展,数字医学影像已日益成为现代医疗最重要的基础手段之一。每天都会有大量包含生理、病理相关信息的医学图像
人脸表情识别是计算机视觉和模式识别领域的一个研究热点,引起越来越多的国内外研究者的广泛关注。人脸表情识别的目标是让人工智能产品能够自动识别出人的表情,进而分析人的内
微博作为一种新兴的社交媒体被广泛使用,其每天的数据交流数量呈现爆炸式的增长,这些数据为自然语言处理提供了良好的语料环境。微博文本具有和短文本一样的长度较短、情感表
人脸表情识别是一项极富有挑战性的研究课题,由于其潜在的应用价值,受到了许多学者的广泛关注。随着多媒体技术和网络视频的发展,对人们的情感分析,了解用户情感变得越来越重要。