基于会话搜索的网页排序算法的研究与设计

来源 :南京大学 | 被引量 : 0次 | 上传用户:brian125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,互联网上的资源数量越来越多。搜索引擎的发展使得用户可以在庞大的信息资源中找到自己所需要的信息。用户可以在搜索引擎上得到自己感兴趣的信息,影响用户信息检索满意度的就是搜索引擎返回给用户的网页信息,并且影响返回给用户网页信息的核心技术就是搜索引擎的网页排序算法,目前主流的网页排序算法主要是Google的PageRank算法和IBM的HITS算法,但是这些算法的设计思想主要是利用网页之间的链接关系,如果一个网页被其他网页的链接次数比较多,搜索引擎就会认为它的网页质量比较高,从而在排序时将它的位置相对靠前,但是这些算法并不考虑用户与搜索引擎之间的交互问题,所以在网页排序算法的改进上面存在很大的提升空间,现在的研究者对于搜索引擎的研究重点主要就体现在搜索引擎的排序算法上。本文首先介绍了现在搜索引擎中主要的网页排序算法以及MDP模型,随后提出了基于用户会话搜索的QCM网页排序算法,其利用相邻查询之间的句法编辑变化和查询变更之间的关系,以及先前检索的文件来增强会话搜索,并将会话搜索建模为马尔科夫决策过程(MDP),文中会通过实验来验证算法的有效性,最后基于QCM网页排序算法设计了一个信息检索原型系统。本文针对于现有网页排序算法的不足,提出了一种基于用户会话搜索的网页排序算法,该算法更加注重用户与搜索引擎的交互,关注用户进行会话搜索过程中检索词的变化,基于检索词的变化采用MDP模型进行建模,这种网页排序算法取名为QCM,最后通过实验进行算法效率分析,并经过设计实验验证,本文提出的QCM网页排序算法在排序效率上有着较大提高。
其他文献
伴随近代基督教在华医药事业的迅速发展,西医学被广泛介绍到中国并对中国传统医学产生了强烈的冲击。中国统治者、士大夫及医药从业人员对来自西方医学的挑战予以了积极的回应
<正>由于拉伸冷作硬化不能充分提高材料的强度,为充分发挥材料的潜力,对Q235钢进行扭转冷作硬化,并对其进行拉伸实验.实验结果表明,扭转硬化可以显著提高Q235钢的屈服极限,并
会议
宗教是人们从头脑中幻想出的关于支配人的生活的异己力量的虚幻意识,本质上是一种“颠倒的世界观”和“虚构的精神花朵”,它依靠对神灵的信仰和对超自然力量的敬畏来支配人们
目的探讨乳腺颗粒细胞瘤的临床病理特征及诊断和鉴别诊断。方法复习2例乳腺颗粒细胞瘤的临床病理资料进行病理形态和免疫组化观察。结果2例GCT无特殊临床症状及体征,细胞境界
硬炭是难石墨化炭,是一种各向同性炭。硬炭前驱体共有三种:化石燃料类,高分子材料类,和生物质类(如淀粉、腐植酸、黄腐酸等)。本文制备了不同形貌、结构的聚丙烯腈/腐植酸(黄腐
中国古典戏曲在长期的演出实践中形成了分工明确的脚色体制,明传奇既是戏曲脚色体制完备的重要阶段,也是戏曲表演艺术成熟的关键时期。脚色的发展和戏曲的发展联系密切,“生
听觉是人类重要的感官功能之一,一旦听力丧失,将会对其学习、生活以及工作造成严重的影响,甚至会影响他们融入社会。目前治疗耳聋的方法有药物疗法、手术疗法和助听器疗法,虽
商用车主要包括客车、货车、半挂牵引车、客车非完整车辆和货车完整车辆,共五类。变速器作为车辆动力传输系统中重要的组成部分,它具有改变传动比、能使曲轴在不改变方向的情