论文部分内容阅读
传统的超文本标记语言只能显示而不能使计算机理解信息,导致传统的基于关键词的检索工具的查准率、查全率和智能化程度都较低。而现有的基于本体的语义匹配技术,只考虑了类层概念,在基于个体概念的微内容发现应用上,查准率较低。本文以语义网相关技术为研究背景,以微内容的聚合与查询机制为研究对象,以改善微内容的发现准确度、智能化水平为研究目的,在以下几方面进行了深入研究:(1)微内容的语义结构和基于本体的语义标注系统。为了使计算机能够理解微内容,必须对其进行语义标注。为此,首先对微内容的语义结构进行了研究,在此基础上提出了微内容标注系统原型;接着,针对该原型存在不具有知识表达能力的缺陷,进一步提出了基于本体的微内容语义标注系统,为微内容的语义聚合奠定了基础。(2)基于OWL本体个体概念和语义关系的微内容聚合机制。分析了聚合模式并选择语义化外围要素作为微内容的聚合模式;在分析了OWL本体的语义要素的分布特征后指出,个体概念的语义特征决定了个体概念的聚合要考虑语义关系的影响,而且微内容与OWL本体的个体层概念之间具有映射关系;分析了微内容基于个体概念和语义关系的聚合原理,并提出了基于个体概念和语义关系的语义索引,作为微内容聚合机制的具体技术实现。(3)基于语义索引的微内容发现算法。结合OWL本体中个体概念的语义分布特征研究了个体概念的匹配规则,然后结合语义索引提出了微内容的发现算法。最后,基于本体创建开源工具protégé和关系数据库,分别构建了OWL本体知识库和语义索引,在此基础上进行了微内容发现算法的仿真实验,证明了语义倒排索引及微内容发现算法的有效性。