论文部分内容阅读
随着Internet网络技术的迅猛发展,网络接入用户量和信息数据量急剧增加,互联网已经深入渗透至社会生活的各个方面,深刻地影响着人类的生产方式与生活习惯。由于不同网络拓扑结构具有明显的差异、多媒体内容在网络资源中的比重不断增加以及网络带宽的限制,这些因素导致网络传输具有较高延时,影响了用户网络访问体验。针对上述问题,研究人员提出了Web缓存技术与Web预取技术,这两种技术都能极大地提高网络带宽利用率、减轻网络出入口吞吐容量并减少用户访问延时,从而改善用户网络服务体验。本文研究了Web缓存技术与Web预取技术,并将两者进行有机结合,提出了一种新的Web缓存模型,该模型的缓存模块为本文提出的改进型缓存替换算法,预取模块采用了基于用户访问模式的预取算法。论文主要完成了如下几个方面的具体研究:首先,通过研究和分析已有的Web缓存替换算法,设计了一种基于协同过滤的Web缓存替换算法GDSF-CF(Greedy Dual Size Frequency Collaborative Filtering)。该算法利用协同过滤技术生成Web对象的预测访问频率,并考虑了用户的访问特征与Web对象的属性特征,通过目标函数的计算确定Web对象的缓存价值;当存储空间需要进行替换操作以容纳新的Web对象时,则对每个Web对象的缓存价值进行比较,替换出价值最小的对象,从而完成替换过程,维护代理服务器的可用性。然后,提出了一种基于对象替换与预取的Web缓存模型MGP(Model of GDSF-CFwith Prefetching)。该模型包含缓存与预取两大模块,缓存模块为本文提出的GDSF-CF替换算法,预取模块采用了基于用户访问路径分析的预取算法,该预取算法通过分析用户的访问序列形成目标网页的预取集合;当用户请求到达代理服务器时,缓存模块与预取模块将共同处理用户请求,有效兼顾了用户访问的时间局部性与空间局部性。最后,通过仿真实验对本文提出的GDSF-CF算法与MGP模型进行了评价与分析,验证了GDSF-CF算法与MGP模型的有效性。