基于隐式反馈的个性化信息检索技术研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:xuanka11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎是互联网用户最常用的信息查询工具。目前主流的搜索引擎并没有明确区分不同用户的查询意图,而不同用户即使输入相同的查询词,其查询需求也是有差别的。个性化信息检索技术正是解决这一问题的关键技术之一。   本文在对现有的国内外个性化信息检索技术研究现状进行分析和综述的基础上提出了一种基于隐式反馈信息的迭代个性化检索算法,并实现了一个基于客户端的个性化检索工具。本文的主要工作有:   第一,对目前的个性化信息检索技术进行了较为全面、深入的综述。根据所采用的个性化信息和个性化检索的实现方式,本文对个性化信息检索研究工作进行了分类和探讨,并对一些有代表性的工作进行了介绍和分析。   第二,提出了一种基于隐式反馈信息的迭代个性化检索算法。基于词和文档之间的相互加强关系(相关文档总是包含许多与查询相关的词,而相关的词总是出现在许多相关文档中),本文提出了一种类似HITS的迭代算法用来计算词和文档的权值,并根据词的权值进行查询扩展,根据文档的权值进行重排序。在迭代算法基础上,利用查询扩展来丰富结果文档,然后通过重排序把文档推荐给用户。实验结果表明,本文提出的个性化检索算法能够有效地提高检索精度。   第三,基于该算法,我们设计并实现了客户端个性化检索工具PAIR。PAIR可以自动地记录用户的隐式反馈信息,分析和推测用户的兴趣需求,并基于Google和百度的查询结果,以Internet Explorer工具条的形式向用户提供中文和英文的个性化检索服务。
其他文献
2002年,OMG(国际对象管理组织)提出了MDA(模型驱动构架)。MDA的目标是把业务和应用逻辑与底层的平台技术分离。基于MDA及相关标准的平台独立应用能够在一些开放或者专有平台上
学位
叙事自动生成是一个重要的研究方向。目前,我们正在研究一种基于知识和用户需求的叙事自动生成方法和系统。骗局是一种特殊的过程,它既可以独立地作为一个完整的叙事,又可以成为
随着本体作为一种信息的组织形式被广泛的应用到水利[1]、词的组织[2]、交通[3]、艺术[4]等相关的领域中,本体的数目和数量增长的越来越快。由于在初期构建本体的时候,专家不
随着通信技术的快速发展和人们对通信技术智能性要求的提高,各种新型网络技术开始广泛使用,自组织网络正是在这种背景下被提出的。移动自组织网络(Ad Hoc)由一系列可以在缺少
随着信息处理技术在通信、金融、工业生产等领域的广泛应用,数据已经不仅仅拘泥于文件、数据表等传统形式。大量连续、变化的流式数据在越来越多的现代应用中出现,例如军事指挥
随着CDN-P2P融合技术研究的深入,CDN-P2P网络在内容分发方面资源定位效率低下的问题越来越突出。为了提高网络的可扩展性与请求内容的响应速度,CDN-P2P中的P2P网络采取无结构
学位
程序员很难保证首次书写的代码是正确的。因此,排错是软件开发过程中必不可少且有相当难度的工作。此外,在软件维护阶段,程序员常常需要对别人书写的代码进行排错。这种情况下,程
随着互联网的飞速发展,电子商务已经走进了人们的日常生活。目前国内有银联、快钱、贝宝等数十家有影响的电子在线支付应用系统正在运营,给电子商务提供了丰富的支付方式。然
近年来,以离散点为表面表达方式的点模型由于其数据获取方便、数据结构简单等优点,成为计算机图形学中的一个新的研究领域。由于许多应用中数据模型的规模和复杂度急剧增长,