论文部分内容阅读
搜索引擎是互联网用户最常用的信息查询工具。目前主流的搜索引擎并没有明确区分不同用户的查询意图,而不同用户即使输入相同的查询词,其查询需求也是有差别的。个性化信息检索技术正是解决这一问题的关键技术之一。
本文在对现有的国内外个性化信息检索技术研究现状进行分析和综述的基础上提出了一种基于隐式反馈信息的迭代个性化检索算法,并实现了一个基于客户端的个性化检索工具。本文的主要工作有:
第一,对目前的个性化信息检索技术进行了较为全面、深入的综述。根据所采用的个性化信息和个性化检索的实现方式,本文对个性化信息检索研究工作进行了分类和探讨,并对一些有代表性的工作进行了介绍和分析。
第二,提出了一种基于隐式反馈信息的迭代个性化检索算法。基于词和文档之间的相互加强关系(相关文档总是包含许多与查询相关的词,而相关的词总是出现在许多相关文档中),本文提出了一种类似HITS的迭代算法用来计算词和文档的权值,并根据词的权值进行查询扩展,根据文档的权值进行重排序。在迭代算法基础上,利用查询扩展来丰富结果文档,然后通过重排序把文档推荐给用户。实验结果表明,本文提出的个性化检索算法能够有效地提高检索精度。
第三,基于该算法,我们设计并实现了客户端个性化检索工具PAIR。PAIR可以自动地记录用户的隐式反馈信息,分析和推测用户的兴趣需求,并基于Google和百度的查询结果,以Internet Explorer工具条的形式向用户提供中文和英文的个性化检索服务。