基于相关度模型的个性化元搜索引擎设计与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:zhpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对着web上面的海量信息,Web用户往往只对其中的很小一部分感兴趣。不同的用户,由于他们各自的需求不同,因此他们需要用不同的“角度”、不同的方式去“看待”Web上面的海量数据,他们所关注的那一小部分信息往往有很大不同。在这种前提下,普通的Web搜索引擎,由于其使用的页面评估技术并不考虑各个不同用户的使用习惯和偏好,因此它们不可能满足所有人的需求。 对这个问题的一种解决办法就是建立个性化的Web搜索引擎。所谓的“个性化”,也就是搜索引擎会根据单个用户的习惯自动调整自己的设置,以使检索结果尽量满足该用户的需求。从某种意义上说,个性化搜索引擎就好像为每一个用户单独量身定做了一个搜索引擎。 本文介绍了一个个性化的元搜索引擎的设计与实现。本文中提出使用词汇之间的“相关度”来存储单个用户的个性化信息。并提出了能够在用户进行检索的过程中自动建立针对该用户的“词汇相关度”信息的算法,以及3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行重新评估并进行个性化排序的算法。 本文首先介绍了构建该个性化元搜索引擎所涉及到的相关技术、相关理论和假设。相关技术主要包含与元搜索引擎相关的技术和与个性化服务相关的Web挖掘技术、文本建模技术。理论和假设主要涉及到关于语义与词汇之间的联系与区别的论述。 然后,本文介绍了这个个性化元搜索引擎的总体设计和实现细节。包括文本模型、各个算法的实现,系统地静态模型和动态模型。 接着文本介绍了在该原型系统上进行的实验以及实验结果。得出如下结论:相关度模型是一种有效的个性化技术,它可以大大提高搜索结果的质量。 最后,对本文的内容进行了总结,并提出了进一步的工作方向。
其他文献
随着互联网的发展,网络为人们提供了极大的便利。但由于构成Internet的TCP/IP协议本身缺乏安全性,提供一种开放式的环境,网络安全成为一个在开放式环境中必要的技术。网络安全包
近年来我国航天事业迅猛发展,航天测发任务也愈加呈现出高密度、高精度、高风险、协调指挥难度大等特点,这些新特点使得发射场需要面临更高的测发要求,即操作人员需要方便、
协同CAD作为CAD技术与CSCW技术的结合,可以有效地缩短产品开发周期,充分地利用异地资源,降低产品的设计成本,近年来这方面的研究工作正在不断深入。由于各个商品化CAD系统之间从
工作流管理是一个被业界广泛应用并迅速发展的技术,它的主要功能是使业务处理过程自动化,协调用户和各种应用程序的工作。随着计算机软硬件技术的发展,特别是Internet和Intra
秘密共享是现代密码学领域中一个非常重要的分支。而秘密图像共享技术是秘密共享在图像方面的拓展,利用该技术分享图像时,可以保证图像的安全性和完整性。目前,已有多种秘密图像
电信业发展迅速,用户对电信业务的需求发生很大变化,原有业务已远远不能满足需要,各电信运营商都希望能方便快捷地为用户提供新业务,竞争策略制高点集中在为客户提供各种新业务上
最优化方法对于解决生活中的问题有着重要的意义,也一直是众多专家学者研究的主题。比较于经典的进化算法和基于梯度特征的优化算法,群智能寻优算法表现出了良好得自组织性,
随着信息技术的迅速发展,XML正在各个领域被越来越广泛的应用,为了有效的管理这种半结构化的数据,XML数据库的概念被提出。根据XML:DB的定义,XML数据库可以分为XML本源数据库
随着计算机网络技术的发展和高校教务制度的改革,建立功能完善、性能良好的综合教务系统管理平台是高校管理工作不可缺少的一项重要工程。本文通过对高校教务管理系统现状及
IPv6网络正以前所未有的速度在全球蔓延。众多由于起步晚而受制于美国的国家,纷纷投入IPv6的研究浪潮,并将此视为互联网重新洗牌后崛起的关键机会。中国在全球IPv6领域已经成为