论文部分内容阅读
Cache是计算机系统中最成功的概念之一,其研究和应用的历史很长。在不同的应用和访问请求模型特点下,分别发展出很多不同cache替换算法。流行的cache替换算法有:利用访问序列的时间局部性的LRU策略、利用空间局部性的LFU策略以及自适应的ARC策略等,它们各有各自最优的应用场合。
本文研究类似SNS web网络的对象访问请求序列模型下的cache替换算法。该模型被称为UDM(User behavior Driven Model)模型。在UDM模型下,彼此互相关联的活跃用户的活动决定了请求序列的特点。本文从系统中用户的关系网络入手,通过挖掘web访问日志记录对用户之间互相访问的概率进行计算。这个用户间互相访问的概率称为用户引用率,用户引用率表明了一个用户在web上活动期间访问系统中其他用户的概率。用户之间通过原创、阅读和推荐等动作,对web上的资源对象进行访问,导致了活跃用户的资源对象在整个SNS web系统的传播得更加深广;而非活跃用户的资源对象的传播范围则非常有限。一个资源对象进入cache容器的价值和该对象在整个用户关系网络中的引用率密切相关。传统的LRU、ARC和LFU策略都不能够捕捉到访问请求序列的特点。通过研究活跃用户关系网络在SNS web中的影响,本文定义了cache对象的影响度(Factor of Influence),使用最小影响度(LFI)策略对cache对象进行淘汰。实验证明,LFI算法较好地适应了UDM对象访问请求的特点,使cache系统能达到更高的命中率。