论文部分内容阅读
语义标注研究如何给本体代表的符号赋予带有具体含义的语义信息。在传统的语义标注中,大部分的研究工作是基于单本体展开的。但是由于标注过程所面对的Web数据事先无法预料,因此,使用单个本体很难满足所有可能的标注对象。尽管本体集成和扩充可以解决这些问题,但这种解决方法的代价太高。此外,仅为了标注去做繁琐的本体集成工作并不可取。为了克服现有语义标注的不足,一种可行的方法是采用多个本体进行语义标注。本文的研究内容包括以下几个方面。
桥本体用本体形式严格定义本体间的桥关系,并形成相应的桥体系结构。桥关系是不同本体间的关联关系,桥本体是特殊的本体。我们对多本体间的桥关系进行了分析,给出了桥本体的定义,并对桥本体的十二种类型进行了分析和描述,同时引入了桥本体的BNF范式表达形式。
本文在本体的实例与结构层次探讨了桥本体的自动生成。桥本体的应用中,不可避免会涉及到多个本体。由于本体数目无法事先确定,使得桥本体的自动化生成技术显得尤为关键,探讨如何实现桥本体的自动生成,是非常有意义的。我们将主要从外延定义上验证桥本体自动生成的可能性,并在结构和实例两个层次上进行了讨论。
我们提出一种采用如上讨论的桥本体来进行语义标注的新方法。该方法采用桥本体理论,避免了不必要的本体集成和扩充,提高了语义标注的精度和效率。桥本体能够自动生成,易于创建、修改和维护,并能表达本体间的多种复杂关系,适用于多本体环境下的各种应用。通过对应用的研究证明,我们的方法是有效的。计算机软件