基于Web使用挖掘的协同过滤推荐算法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:tjkjkfzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展、电子商务应用的不断普及,越来越多的信息充斥在互联网之上。面对如此多的资源,如何快速找到自己真正所需要的信息,成为众多研究学者、理论专家和网络用户关心的关键问题之一。在这样的环境下,推荐系统应运而生。实现个性化推荐的具体技术有很多种,其中协同过滤推荐是当前电子商务环境下应用最成功和广泛的推荐技术之一。然而随着站点结构、内容复杂度和用户数目的不断增长,协同过滤推荐算法也遇到了实时性、数据稀疏性、可扩展性等种种问题。传统的协同过滤推荐系统都要求用户对项目进行评分,这样往往会打断用户的浏览过程,甚至影响到用户的情绪;另外相当多的用户不愿意评分,导致评分数据集的极端稀疏。在这种情况下,本文将提出一种基于Web使用挖掘的用户-项矩阵模型的构建方法。该方法通过对Web日志进行有效的数据挖掘,发掘隐藏在日志背后的用户、项目、访问时间和访问次数等信息来获取用户评分值,在不影响用户正常浏览的情况下完成了数据的收集。因为用户对页面的浏览覆盖率比用户对页面的显式评分要更加真实客观,所以相对于传统的数据集,本文提出的方法所收集到的数据要全面得多。针对传统协同过滤的实时性和数据稀疏性问题,本文将提出一种改进的协同过滤推荐算法。其基本思想是:在原始数据集中结合用户间和项目间的双向信息,即利用用户的最近邻和项目的最近邻对未评分项目进行协同式的平滑处理,以降低矩阵的稀疏程度,解决推荐算法的稀疏性问题。在此基础上,运用数据挖掘领域的聚类算法对系统中所有用户进行用户聚类,尽可能地把相似的用户聚在同一个用户类中,而把不相似的用户聚到不同的用户类中,这一步可采用离线周期进行。在线推荐时,只需要计算目标用户与各个用户聚类簇中心的相似性,然后在最相似的前若干个聚类簇中查找目标用户的最近邻,最后根据目标用户的最近邻居集的信息对各个项目进行评分预测,向目标用户提供推荐。这样缩小了搜索邻居的范围,提高了推荐算法的实时性。最后通过实验对改进的协同过滤算法进行了测试,验证了算法的合理性和有效性,进而证明了本文提出来的算法可以较有效地克服用户评分数据非常稀疏下传统方法存在的不足之处,有效地提高了推荐算法的实时性和准确性。
其他文献
随着信息技术、图像压缩技术和网络技术的发展,网络视频监控系统对数据采集的实时性、视频图像编码、有限网络带宽下传输实时性和视频质量等都有了更高的要求。本文针对基于D
计算机图形学技术不断发展并在影视和电子游戏等领域得到了深入的应用,三维模型的几何处理已成为重要的技术环节。随着因特网上三维模型急剧增加,从中快速找到所需的模型,并
交通标志识别作为智能交通系统的一个重要研究方面,在道路安全、信息指示等方面的作用越来越凸显。但是目前交通标志识别在数据量、识别率等方面都存在一些不足,而对交通标志
随着计算机硬件技术和图形处理技术的进一步发展,虚拟现实技术越来越广泛运用于人们的日常生活中,包括科幻影视、体感游戏、智能穿戴等。而虚拟植物建模研究作为计算机图形学
移动自组织网络以其特有的开放性和动态灵活性,在缺少固定基础设施的商用环境中,军事及紧急灾害场景中拥有广泛的应用前景,受到了学术界和工业界极大的关注。节点的相对独立
DNA微阵列技术是基因组信息学研究的主要支撑技术,它为癌症研究提供了最基本和最必要的信息及依据。然而由于基因芯片数据样本少、高维数高的特点,在基因芯片数据处理时面临
便捷、准确的无线网络技术得到飞速的发展,特别是具有组网灵活、自适应性强、覆盖范围广的无线Mesh网络,更是如此,并逐渐成为下一代无线网络的主要代表。为了应对当前各式各
面向服务架构(Service-Oriented Architecture, SOA)以其灵活性,可重用性等特点已经逐渐成为系统间取得互用性的有效机制,SOA允许现存的遗产系统将其业务功能以服务的形式应
随着嵌入式系统的发展,嵌入式显示设备也在不断地更新换代,从CRT到LCD,再到近年来出现的电子纸显示技术。电子纸显示图像,具有功耗低、对比度高、可视角度大、强光下可阅读等
多传感器、信息融合技术与传统机器人的结合构成了智能机器人。在以往机器人智能领域的研究中,由于忽视了对多个传感器之间的综合分析,对提高智能系统的性能带来了不利影响。