基于Ontology的语义检索技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：wangya110

【摘要】

：

WWW的迅速增长使得其信息量已经远远超过了个人的信息阅读和理解能力，面对如此众多的信息，人们往往利用基于关键词的检索引擎帮助进行信息的检索，但它只能检索出很小部分的相关

【作者】

：

栾艳

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2006年期

【关键词】

：

语义检索信息检索 Ontology 层次活动扩展检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

WWW的迅速增长使得其信息量已经远远超过了个人的信息阅读和理解能力，面对如此众多的信息，人们往往利用基于关键词的检索引擎帮助进行信息的检索，但它只能检索出很小部分的相关信息，且返回结果经常会包含大量的无用信息，这些情况给人们寻找所需信息带来了很大的困难。而基于Ontology(本体)的语义检索作为一种极具潜力的新技术，能够帮助人们解决以上难题，近年来逐渐受到越来越多的关注。 Ontology是语义网(Semantic Web)的重要组成部分，是对信息世界或者领域知识、概念、实体及其关系的一种明确的、规范的形式化描述。Ontology在信息检索，尤其是自然语言检索领域中，能使用户和计算机利用其所提供的知识体系，真实而统一地理解网络文本资源和用户请求，在增强人机交互的同时，将检索从字面匹配层次提升到知识匹配的层次，提高了信息检索的功效。利用对Ontology的处理，能够消除自然语言理解中的歧义，明确概念涵义，并且根据相关概念进行推理，挖掘隐含信息，从而提高检索的准确度和覆盖率。本文首先介绍Ontology的概念，综述了基于Ontology的语义检索技术的研究现状，并在此基础上构建了一个基于Ontology的语义检索处理框架OSS(Ontology—basedSemantic Search)，并描述了其检索的具体过程。为了建立基于Ontology的语义检索系统，本文进一步给出了一种改进的建立Ontology领域本体的方法，并在此基础上讨论了Ontology信息抽取和对网页中的Ontology信息进行语义标引的方法。OSS框架、本体建立、语义标引等三个方面的工作和第三方软件共同构成了一个基于Ontology的语义检索系统实验环境。本文着重描述了OSS检索处理框架实现的关键技术，详细阐述了该模块中用到的几个关键算法。其中，为了提高系统检索结果的准确度和覆盖率，提出了层次语义扩展检索处理算法；为了减少检索处理的响应时间，设计了检索结果暂存处理算法；为了优先向用户提供符合用户兴趣特征的检索结果，设计了检索结果合并和排序算法。实验证明这些算法在实际的检索过程中取得了比较满意的效果。本文最后利用对招聘网站上相关网页文档信息检索处理的实例实现了基于Ontology的语义检索实验应用，从而验证OSS在处理方法的可行性。OSS检索处理框架的实验结果与网站上传统检索处理结果相比较，在检索的准确度和覆盖率上都有所提高。

其他文献

基于马尔可夫链的期望到达时间距离学习

随着移动互联网的高速发展和智能设备的广泛普及,各类图像和文本数据在以前所未有的速度迅速膨胀,基于大数据的各种机器学习应用正在蓬勃发展。围绕机器学习算法中常用的距离

学位

距离度量马氏距离马尔可夫链期望到达时间

安全服务平台的UDDI、登陆认证、远程访问和入侵检测的设计与实现

对于那些存在着服务提供方和服务使用方的信息系统，传统的服务提供方式在通讯安全、认证机制、访问控制机制、审计信息、服务收费、信任评估、系统监控、黑客入侵等方面存在着

学位

UDDIUDDI单点登陆单点登陆TelnetTelnet入侵检测入侵检测Web服务Web服务

并行防火墙研究

在网络安全中，防火墙是建立网络边界、加强网络安全的重要设备。根据防火墙工作的层次和方式，防火墙上可以分成包过滤防火墙、代理防火墙。包过滤防火墙由于出色的性能而被广泛

学位

计算机网络网络安全并行防火墙数据过滤

基于Windows的远程复制系统的研究和开发

本文对基于Windows的远程复制系统的开发进行了研究。文章针对当前的数据复制技术进行了研究和讨论，提出一个Windows平台下的远程复制系统(Remote Volume Replicator，简称RVR)，

学位

数据容灾数据备份远程复制

面向检索的三维模型骨架抽取技术研究

随着计算机软硬件技术的不断发展，多媒体技术的逐渐成熟，三维模型这种相对于二维图形、图像更加有表现力的媒体形式逐渐流行，并成为多媒体组成中的重要成员。虽然三维模型的创建

学位

三维模型多媒体检索网格模型骨架抽取技术面向检索

基于Web GIS的楼宇信息系统的设计与实现

WebGIS——基于Internet的地理系统是将网络与地理信息系统相结合的产物，也是网络发展的必然趋势。将WebGIS应用于楼宇信息管理系统(BIS)，采用B/S模式的体系结构，最终实现楼宇各

学位

组件技术矢量图形楼宇信息系统地理信息系统WebGIS

PKI技术的应用研究

全球经济发展正在进入信息经济时代，知识经济初见端倪。但随着Internet、E-business的发展，信息系统安全问题越来越引起世界上各国、各行各业的人们的关注，它所涉及的范围非常广

学位

数字签名加密信息安全公钥基础设施身份验证证书管理

服装类商品属性实体识别与规范化研究

服装类商品占据电子商务市场巨大份额，而针对的服装类商品属性实体识别的开放研究却较少。对服装类商品属性实体识别技术的研究，为电商信息检索、个性化商品推荐、广告系统、以

学位

电子商务服装类商品实体识别实体规范化图像处理

面向XML数据处理的乐观并发控制技术研究

由于XML具有自描述、语法简单、可扩展性强等优点，广泛应用于电子商务、电子政务等应用系统中，并发展成为数据交换和数据表示领域事实上的标准。随着XML数据量剧增，研究人员提出

学位

XML数据库乐观并发控制技术内存共享机制多核环境

搜索引擎中的网页自动聚类和多文档自动摘要技术

搜索引擎作为互联网上最主要的信息搜索工具之一，是广大网络用户用于查询信息的主要工具。然而，近年来，由于网络信息量迅猛增加和网络信息组织的无序性，用户很难从传统搜索引擎返

学位

搜索引擎网页聚类向量空间模型多文档自动摘要文本关系图相似度计算

基于Ontology的语义检索技术研究

与本文相关的学术论文