需求概念图导引下的网页检索结果分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lllljx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代社会,网络是信息的重要来源,而搜索引擎是网络资源的主要入口。能否快速准确地获取所需信息很大程度上取决于搜索引擎性能的优劣。目前的搜索引擎大多基于布尔模型、向量空间模型和语言模型,将需求和网页视为离散的词汇集合,只考虑词汇的共现。这些模型割裂了词汇间的联系,忽略了文本蕴涵的语义信息,带来大量噪声,导致精确度偏低。针对上述问题,学者们提出多种基于语义的检索模型。  基于内涵语义的概念图模型试图构建文本的概念图,还原文本所表达的概念并重建概念间的关联。由于概念图能够较好地表示文本语义信息,可以将概念图作为文本的语义表示方法,应用到语义检索。  本文的工作包括四个部分。第一部分提出基于概念图的网页检索结果分析框架,并在该框架下对若干实例进行人工分析。  第二部分在需求概念图导引下对网页摘要进行标引生成精简摘要概念图,这种方法避开网页标引,关注相对简单的摘要标引,自动化程度高且不依赖完全句法分析。  第三部分分析网页检索的错误结果归纳错误类型,提出两种基于需求概念图和精简摘要概念图的方法对网页检索的错误结果进行过滤。实验表明同时使用两种方法能够有效提高检索精度。  第四部分试图改进过滤方法使它们能够应用于网页检索结果排序,是对需求概念图导引下的网页检索结果排序的有益尝试。  本文探索在需求概念图导引下对网页检索的结果进行分析,希望能够为基于概念图的语义检索模型的研究提供一些思路。
其他文献
教授主页信息管理与发布系统是中国地质大学(北京)数字校园建设中的子系统。原有的教授主页信息管理与发布系统是基于ASP技术实现的,其代码执行效率不高,由于运行在IIS服务器
家庭信息化程度正随着3C行业的快速发展而逐步地提高,网络化、智能化的趋势已经成为数字家庭产业的共识。数字家庭网络化的目的在于通过建构完整的家庭网络架构,进行内部设备
随着电子产品的普及和网络的发展,数字图像受到广泛应用。数字图像易于存储,复制。在为图像的传输提供便利的同时,却为版权保护带来了困难。  数字水印就是为了满足这一需求而