论文部分内容阅读
语义Web被看成是当前Web的扩展,目前已经成为数据与知识工程领域的研究热点。语义Web需要新模型以支持对Web信息源和服务以及智能应用的统一访问。RDF是一个网络资源对象和其间关系的数据模型,RDF定义的底层数据模型能使信息在应用程序之间交换但是不丧失信息本身所具有的语义。现有支持语义Web的RDF查询语言主要有以下几种:RDQL、RQL、eRQL、 N3QL、Triple、SPARQL等。在现实应用中,用户查询意图具有不确定性,但大多数现有的RDF查询系统都不能直接处理具有模糊信息的查询,从而不能充分满足用户的模糊查询意图,因此,基于RDF的模糊查询的研究也是语义Web领域的一个重要课题。目前基于RDF的模糊查询研究中存在以下问题:不能基本满足用户模糊查询需求的表达的问题;不能满足用户对查询结果有复杂偏好的要求;经典的RDF查询语言返回的结果是无序的,不能满足用户的结果排序要求。本文研究的核心内容是:以RDF为查询对象,选用作为推荐标准的SPARQL查询语言,针对人类模糊语义信息的表达提出了一种模糊查询方法。首先,本文对现实模糊语义信息的表述形式进行区分,从宏观上分为模糊术语和模糊关系两种,以近年来发展应用的模糊集合理论为基础,对经典SPARQL查询语句中的FILTER约束条件进行扩展;其次,本文提出了多维度偏好结构,为用户提供灵活的偏好表示形式。本文采用经典的排序算法,结合基本条件中的隶属度的满足程度及用户偏好,对中间查询结果集排序。另外,由于需要使用处理精确SPARQL查询的查询设施对模糊语法进行验证,本文的工作还包括将f-SPARQL查询转换为精确SPARQL查询,给出了语法扩展部分相应的转换规则。最后,本文实现了模糊查询原型系统并进行了实验设计和实验结果分析,结果表明,本文提出的带有有序语言值及多维度偏好的模糊查询语法结构具有很高的查全率;同时,由于本文提出的模糊查询语法很符合人类自然语言的表达习惯,在查准率方面,本文的方法具有很大的优势;在系统响应时间上,本文的原型系统也具有很好的性能。