基于资源时效的协同过滤算法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:wangxingkun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着WWW的快速发展,信息过载成为人们获取有效信息的一个障碍,个性化服务技术应运而生。推荐系统是个性化服务技术在Web 应用中最重要的形式,它融合了搜索引擎、数据挖掘、机器学习等技术,能够基于用户的口味和喜好等提供相对精确的推荐,在电子商务系统得到了广泛的应用。   目前,几乎所有大型的电子商务网站,如Amazon、CDNow、Netflix、eBay、阿里巴巴、拍拍网等,都不同程度地使用了各种形式的推荐技术。协同过滤算法是当前推荐技术中最有效的信息过滤技术之一。它通过比较用户之间的相似性来过滤信息,应用于推荐系统不仅能为用户带来新的感兴趣的资源而且不受资源形式的限制。但这些传统协同过滤算法的最大弱点是可扩展性问题,即随着用户数量以及商品项目的增加,计算复杂度快速增长导致大规模电子商务系统的性能瓶颈。   本文针对上述协同过滤算法的问题,从时间信息角度出发,分析了用户兴趣漂移现象,阐述了考虑用户兴趣变化而发展起来的基于时间加权的协同过滤算法。同时重点考察项目的时间信息属性,提出一种新的基于资源时效的协同过滤算法。   本文的创新点主要有两个,一是通过对用户评分/购买历史进行分段,侦测用户兴趣变化和计算用户兴趣度,使基于时间权值的协同过滤算法更具个性化;二是整合项目的时间信息属性,提出项目的资源时效概念,为项目时间信息的使用提供了具体形式,并在此基础上发展了基于资源时效的协同过滤算法,和基于资源时效的搜索引擎查询分析技术。   本文在实证部分采用Grouplens的MovieLens 数据进行了以上理论的操作,并对结果进行了验证。验证比较了基于时间权值的协同过滤算法和基于资源时效的协同过滤算法。验证结果表明:项目的时间信息对待推荐候选集具有很强的约减作用,恰当使用该信息可以提高推荐精度。
其他文献
互联网的高速发展使得现有的互联网体系架构已经不能满足人们日益增长的多样化需求,为此相关学者将虚拟化技术应用到网络体系架构中,通过网络虚拟化支持多网络体制并存来解决
信息抽取是指从一个给定的文档集合中自动识别出预先设定的实体、事件等信息,并对这些信息进行结构化存储和管理的过程。目前大多数的信息抽取系统采用的是模式匹配的方法,且通
圆柱形零件在现代制造业中有着非常广泛的应用,而圆柱形零件本身质量的优劣对于其制成品的质量也有很重要的影响。因此,圆柱度误差作为衡量圆柱形零件形状误差的一个重要指标,已
当软件发生变更时,如添加新的功能或修正错误后,就需要进行回归测试,以确保这些变更不会对软件产生负面影响。然而频繁的回归测试带来的开销,特别是时间上的开销很大,约占软件维护
随着Internet与网络技术的迅猛发展,万维网上的信息以海量方式增长,然而我们却不能快速而准确获取有效的信息。因为这些信息大多隐藏在深网里,需要通过查询接口在线访问后台
本硕士论文的背景是四川省网络通信技术重点实验室进行的有关下一代Internet体系结构的研究工作,即“单物理层用户数据交换平台体系结构”(SUPA-Single physical-layer User-
随着我国居民汽车保有量的不断增长,道路交通安全问题就变得越来越突出。而在各种导致交通事故的因素中,驾驶员的疲劳驾驶是非重要的一种。因此如何能快速有效的判断驾驶员的
伴随着信息高速公路的建设,数字技术、数据库技术迅猛发展,人类的数据库里积累了越来越多的历史数据,而从这些海量的数据里探索出实用的有价值的信息对人类社会的发展有着重要的
网络虚拟化技术被视为构建新一代互联网体系架构的重要技术之一,其本质是通过对物理网络的资源进行适当抽象,然后采用有效的资源分配算法和资源使用隔离机制等技术,在同一个
北京奥运会除了本身规模空前外,比赛场地更是前所未有地分布在了7个不同的城市,还涉及38个竞赛场馆和18个非竞赛场馆,7个IT场所和2200场比赛,包括超过900台服务器、7000台电脑终