基于链接分析的搜索引擎排序算法研究

来源 :四川师范大学 | 被引量 : 4次 | 上传用户:liongliong524
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展,Web成为了人们获取信息的重要途径。但是,网页数量的与日剧增,信息量的爆炸式增长,也为人们的信息查询带来了不便,如何快速、准确地检索到用户真正感兴趣的信息成为了目前各大搜索引擎公司不断改进技术的目标。Web数据挖掘技术的引入提高了检索质量,特别是Web结构挖掘在搜索引擎中的应用,很好地帮助用户快速地从搜索结果中锁定对自己真正有用的信息。本文研究了基于Web结构挖掘的两种经典算法PageRank和HITS。针对PageRank算法,研究了该算法的基本思想,讨论了网页的链接结构对页面PageRank值的影响,并提出相应的提升网站排名的策略。分析了PageRank算法存在的缺点,主要就其产生主题漂移的问题提出了一种基于查询主题相关性的PageRank改进算法,并通过实验数据验证算法的有效性。对于另一种搜索结果排序算法HITS,集中研究了算法的思想和实现步骤,归纳了算法的缺点,主要分析了产生主题漂移的原因,并提出了基于页面相关性的HITS改进算法,通过一组对比实验,验证了改进算法的优越性。
其他文献
聚类分析源于许多研究领域,包括数据挖掘、机器学习、统计学、模式识别等,它是数据挖掘中的一个重要分支。目前,数据挖掘技术的一个突出特点是处理巨大的、复杂的数据集,这对
本文考虑的是如下Lotka-Volterra系统   它是一类重要的应用数学模型,广泛存在于物理、化学、生物、动态博弈论、经济等自然科学和社会科学中.众所周知,在这类方程的研究
学位
本刊讯HEATEC 2017“上海国际供热及热动力技术展览会”及旗下的BOILER SHANGHAI 2017“第十五届上海国际锅炉、辅机及工艺设备展览会”、BIOTEC 2017“上海国际生物质能利用
本学位论文中,我们首先构造了与Schr(o)dinger算子L=-Δ+V相关的广义Morrey空间,记为Lp,q,λα,θV(Rn).其次我们推广Schr(o)dinger算子,讨论了一些位势函数V满足逆H(o)lder类Bs
本文研究了两类不确定非线性系统的鲁棒滑模控制问题,具体地:   (1).针对一类含有时变时滞的不确定非线性时滞系统,通过结合鲁棒控制技术、滑模控制技术与自适应神经网络
Hardy空间的实变理论是上世纪70年代以来调和分析中最富有成功的领域之一.经过许多数学家的多年努力,经典Hardy空间理论基本成熟.针对单参数情形Rn,数学家们建立了与微分算子
问题
期刊