【摘 要】
:
随着互联网技术的快速发展,搜索引擎技术随之诞生。人们总是希望通过搜索引擎找到最相关、最权威的网页,而搜索引擎网页排序算法的好坏直接关系到用户能否找到这样的网页。所
论文部分内容阅读
随着互联网技术的快速发展,搜索引擎技术随之诞生。人们总是希望通过搜索引擎找到最相关、最权威的网页,而搜索引擎网页排序算法的好坏直接关系到用户能否找到这样的网页。所以搜索引擎网页排序算法已经成为衡量商业搜索引擎是否具有核心竞争力的技术之一。本文介绍了搜索引擎的发展历史和工作原理,分析了网页排序算法对搜索引擎性能的重要影响,同时深入研究了现有的经典PageRank算法与HITS算法以及国内外相关的改进算法,并从这些算法中吸取相关思想、分析其中不足,从而提出了新的改进算法SPR。现有的网页排序算法主要是基于网页链接结构分析,代表算法有PageRank与HITS,而基于网页链接的排序算法只解决了网页的权威性问题,很容易造成查询主题的漂移,因此本文从网页内容相关性角度来解决主题漂移问题。PageRank算法平均分配权重的方法是不合理的,因此本文提出了按照网页流行度来进行权重分配的方法。综合网页链接结构与网页内容两方面改进经典的PageRank算法,从而得出本文的SPR算法。该算法模型从链接结构上解决权威性问题,并且它比经典的PageRank算法在传递网页权重时更具合理性;同时从网页内容的角度解决了主题相关性问题,削弱了主题漂移现象。本文最后通过构造一个搜索引擎模拟器,并利用经典的PageRank算法与本文改进的SPR算法分别得出搜索结果。同时设计出一个评测标准,利用此标准对上述两种算法的实验结果进行评测,最后通过对比分析评测结果进而肯定改进的SPR算法。
其他文献
基于无线通信的列车控制(Communication Based Train Control, CBTC)的列车自动监督(Automatic Train Supervision, ATS)系统主要实现对列车运行的监视与控制功能,通过ATS的
网络规模的飞速发展和宽带技术的广泛应用,使得互联网传输数据的流量以非常快的速度递增。大量的数据交换对互联网的核心设备一路由器的性能提出了越来越高的要求,尤其是要求
随着计算机技术与图形学的迅速发展,计算机动画已经被广泛应用到影视制作、游戏动画、广告、医学及教育等领域。运动捕获技术以其无可比拟的真实感和后期编辑技术的强大性成为
无线传感器网络作为21世纪具有重大影响力的技术之一,成为自动化技术研究领域的研究热点。工业无线传感器网络是在传统无线传感器网络基础上发展而来的,除了具备无线传感器网
在智能信息处理中,基于语义的词语相似度计算是一个非常基础而关键的问题,广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域。词语相似度计算的算法有很多种,大部分
当面对复杂多变的环境和陌生的任务时,即使是功能非常强大的计算机系统(如计算机网络、机群等),其表现也不能令人满意。一个重要的原因是,不同的任务要求系统具有不同的功能,
随着多年来虚拟化技术的不断发展,云计算逐渐普及,现代1T企业的工程师们不再满足于仅通过虚拟化技术来获取具有计算能力的虚拟机节点,而开始逐步将目光投向更加理想的应用开
近年来,随着我国车辆的增加,高速公路给人们带来许多方便,但同时也引发了许多新问题,超速,超载等违章现象以及汽车犯罪现象等加剧,伤亡事故不断发生。而且高速公路上一旦发生
随着游戏、仿真等图形技术的不断发展,以及工业设计、模拟仿真、三维影视等对三维复杂物体模型应用需求的不断增加,关于三维模型重建的相关研究越来越受到人们的重视。而由于
随着互联网的迅猛普及,网络在人们生活中所占的比重也越来越大,网络中出现大量与XML数据流有关的应用,比如网络日志、股票分析、互联网监控、数据安全管理、位置信息、电子信息