基于语义距离的RDF本体查询方法研究

来源 :东北大学 | 被引量 : 4次 | 上传用户:caful
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网规模的空前扩大和数据量的急剧增加加大了人们获取信息的难度,同时也造成了大量的垃圾信息充斥着当今的网络。如何迅速地、高效地检索和访问各个领域的信息资源已成为一个亟待解决的重要问题。基于此,Berners-Lee提出了下一代Web的发展方向——语义Web,其目标是使Web上的信息能够被机器理解,从而可以更加高效地检索所需要的信息。RDF(Resource Description Framework,资源描述框架)是语义Web的重要组成部分,作为一个通用的元数据模型标准,它使得语义Web上的语义检索成为可能,并被广泛地应用于语义Web的各个领域。随着RDF的广泛应用,对RDF本体的查询要求也越来越高。在RDF本体查询中,一方面,随着RDF本体数据规模和复杂性的增加,要求大量普通用户了解本体的结构和内容已不现实,在这种情况下即使用户明确其查询意图,仍有可能返回过少甚至空查询结果;另一方面,不同的用户对同一种事物可能存在不同的描述,一义多词(同义词)以及外文词形变化(例如:时态和单复数)等现象普遍存在,这些都是目前RDF本体查询中无法避免的问题。此外,查询处理后可能面临多查询结果问题,此时希望系统能够对查询结果自动进行排序或分类以避免信息过载,返回与初始查询在语义上相关的查询结果。针对以上情况,本文提出了基于语义距离的RDF本体查询方法。针对返回结果为空或少量和一义多词的情况,提出了查询松弛和同源词替换相结合的方法,通过RDFS的蕴含规则对初始查询进行松弛,进而选取合适的松弛查询进行同源词替换来得到更多的查询结果。针对要求返回与初始查询在语义上相近的结果的情况,本文提出了语义距离的概念,通过语义距离的计算从而选取与初始查询在语义上相近的结果。在上述查询策略以及语义距离的基础上给出了查询算法,并实现了一个简单的原型系统,通过实验验证了本文提出的基于语义距离的RDF本体查询方法的可行性,并与现有的RDF查询方法进行了比较,证明了本文所提出的方法在查准率以及查全率上均具有一定的优越性。
其他文献
随着计算机和通信技术的不断发展,Internet已经成为当今社会生存与发展必不可少的重要资源。随着网络的演进,在以IP电话、在线购物、视频会议等为代表的实时应用日益繁荣的同
近年来,伴随着互联网技术的不断发展,基于Web的各种应用也越来越得到了人们的重视。将Web技术与数据库技术相融合,使数据库成为Web的重要组成部分的Web数据库已经成为目前数
电能量数据采集终端是在电能量计费系统中介于计量主站与费率装置(电能表)之间的中间设备,主要具有电能量数据采集、处理、存储、加工及转发等功能。设计出可以有效实现快速、
论文以目前计算机科学与技术领域广泛讨论和应用的分布式存储、分布式计算和内容仓库标准接口为背景,结合内容管理系统项目,研究如何用Java内容仓库封装分布式文件系统,实现
随着通信技术的发展,融合性和异构性成为未来网络的主要特征。如何在异构网络中为用户提供端到端的QoS保障成为了关键性问题。相关标准组织和研究机构为解决上述难点进行了很
无线传感器网络是由部署在监测区域内大量的廉价微型传感器节点组成,通过无线通信方式形成的一个多跳自组织网络。传感器网络中的节点通常采用电池作为电源,能量十分有限,且
本文介绍了对GSM和TD-SCDMA共位置区方案所做的研究。GSM和TD-SCDMA分别是2G和3G的技术标准,由于投资保护和网络演进的需求,实际运营的网络架构中将出现两张网络长期共存的局
Distributed Service Network (DSN)是针对电信业务和移动互联网业务所提出的新一代可运营、可管理的分布式核心网体系架构。DSN核心网基于P2P架构,没有中心节点,由大量的对
随着社交网络服务的快速发展,SNS已经成为网络用户重要的基础应用之一。本文首先本文首先总结了SNS的基本概念和发展现状,然后对集中式SNS和分布式SNS的特点进行分析,提出了
随着网络技术和计算机技术的飞速发展,网上的信息呈带宽的指数级增长。在这样一个信息量爆炸的社会中,人们希望通过网络获得大量信息,而搜索引擎就是在这样的背景下诞生与发