基于用户兴趣的查询扩展

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yus520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速发展的现代互联网在给人们带来大量信息的同时,也不可避免地产生了难以让用户快速获取有效信息的问题。搜索引擎的出现使这一问题得到了一定程度的缓解。它面向任何Web用户,无需用户具有较高的专业检索知识,使用方式也较为简单。搜索引擎已经成为人们获取信息资源的一种主要方式。   然而,现代搜索引擎也存在很多不足。由于目前大部分通用搜索引擎所采用的关键字匹配的检索模式,以及自然语言当中存在的一词多义的现象,造成了搜索结果中包含许多与用户需求无关的信息,降低了用户的检索效率。同时用户在进行信息检索时,一般用1~2个关键词,造成无法准确检索出用户需要的内容,这就是所谓的“短查询”问题。本文希望通过对不同用户的兴趣和背景进行挖掘,利用查询扩展技术,为不同用户提供不同的检索结果。满足其个性化需求。   本文使用网页分类技术对包含某词语的网页进行分类分析,发现了词语具有类别属性,即大部分词语通常只在某一个或若干个类别当中有意义,可以利用这一特点来表示用户的查询目的。   本文主要对以下几个方面进行了研究:   (1)首先介绍了查询扩展这个领域的研究现状、发展方向及研究意义。讨论了与用户兴趣模型有关的技术和概念。   (2)改进了存储用户兴趣的存储结构。增加了关键词的创建时间和最近一次访问时间两个属性,有效地记录了关键词在树形结构中的存在时间和活跃程度。   (3)改进了用户兴趣模型的生成与更新算法。根据关键词的存在时间以及未被用户访问的时间长短,衰减关键词的权值。有效地缓解了过期关键词对用户当前查询的影响。当关键词的权值小于给定阈值时,将其从用户兴趣树中删除,达到对用户兴趣树的维护与更新。很好地模拟了用户的兴趣变化。   (4)根据上面的研究设计并实现了基于用户兴趣的查询扩展系统。通过实验证明本文的系统相比其他系统有一定的优越性。  
其他文献
随着Internet技术的不断发展和人们对空间信息系统的需求,为用户提供网络空间数据浏览、查询和分析的功能,已经成为空间信息系统发展的必然趋势。由此,网络地理信息系统(WebGIS)应
随着现代科学和技术的发展,语音识别技术在人机交互中的地位越来越重要。目前非特定人孤立词语音识别系统被广泛应用于手机、PDA等各种智能终端产品中。同时随着嵌入式技术的
学位
随着无线传感器网络研究的深入,数据融合成为该领域的一个热点问题。本文围绕无线传感器网络无损数据融合技术展开讨论,研究内容包括以下三点。   首先,本文通过理论方法
学位
在社会分工日趋精细的今天,协作的重要性亦日趋突显。企业内部的协作,必需通过网络来实现,网络应用因此就显得越来越重要。在这种情况下的企业应用系统,性能是一个非常重要的
随着社会经济和科学技术的发展,交通管理也正向信息化、智能化和无人化管理的方向发展。车牌识别技术作为智能交通管理的核心技术,在现代化的交通管理系统中占有重要的地位,
生物信息学自上世纪90年代人类基因组计划全面开展以来,已成为21世纪自然科学的重要前沿领域之一。随着越来越多的模式生物测序完成,开始进入后基因组时代。其中转录调控是后
学位
近年来随着3G的商用部署和手机的跨领域功能融合,越来越多的互联网应用搬上了手机。嵌入式浏览器无疑已成为人们触及手机互联网应用的最好媒介。嵌入式Web浏览器已逐渐成为高
学位
互联网及信息技术的高速发展带来了网络信息量爆炸式增长。在互联网上“Pull”信息的方式暴露出越来越明显的缺点。RSS(Really Simple Syndication,真正的简单聚合)随即出现
学位
目前动画技术已经深入渗透到众多领域。全过程计算机辅助动画自动生成是一个结合人工智能与现代多媒体技术的课题,由中科院陆汝钤院士首次提出,并研制出原型系统《天鹅》。古
学位
人工智能是计算机科学的一个分支,是用于模拟和扩展人类智能的理论和技术方法。人工智能在上个世纪50年代被提出,经历了半个多世纪的发展,人工智能已经成为了一门庞大的科学,