论文部分内容阅读
目前在万维网上的网页资料以几何级数爆炸性增长,但由于缺乏组织和管理人们难以充分利用这些信息资源。因此人们开始寻找新的方法来改变传统的通过搜索关键字来查找信息资源的模式。自从Lee提出语义网这个概念后,这个新名词也被用在了信息检索领域。在检索的智能化过程中,本体扮演了非常重要的角色。本体(Ontology)是一种新的基于Web的信息组织方法,它能够有效的对因特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。法律框架网络数据库是以由Fillmore主持的始于美国加州大学伯克利分校的FrameNet计算词典编纂工程为理论框架,以框架语义学理论为基础,依据中国法律特点对FrameNet中涉及的法律领域框架进行分类整理和修正,该数据库又包含了框架库、词汇库和例句库三个子库。框架库中每个框架包含了描述框架的基本信息、构成框架的框架元素、隶属于某一框架下的词元以及框架元素对应的语义类型和框架间关系等信息。在本文中,我们主要处理框架库,将每个框架下的相关信息通过程序实现法律框架本体的自动生成,词汇库和例句库的本体自动生成将是我们以后要做的工作。Jena是由hp公司开发的Java语言开发包,用于开发基于Semantic Web的应用程序。我们在构建法律框架网络本体思想的基础上,利用Java调用Jena包自动生成法律框架本体的模板,然后建立数据库数据与模板的对应关系,即确定哪些数据应放在哪些模板类下,最后再通过SQL语言调用数据库里的数据,将数据自动添加到模板中对应的类或属性下,并按照规则提取出限制条件。为了使软件方便人们利用,我们用JSP技术制作了网页用户界面,在该界面中用户可以选择需要生成本体的部分框架也可以选择全部框架,最终来实现法律框架网络数据库到本体的自动转换。由于该软件是完全以数据库为基础的,它无法处理数据库中没有的信息,因此丢失了一些重要的无法用数据库存储的信息,鉴于此,我们借助于Protégé软件,通过该软件手工输入丢失的信息,待所有的信息添加到本体中后,我们又借助工具Racer对本体从一致性和分类合理性两方面进行检验,最终对本体的性能做出评价。论文中编写的转换工具为数据库与本体之间的转换提供了思路,并为日后的例句库转换到本体提供了基础。