论文部分内容阅读
自然语言处理的研究目的是如何利用计算来理解和生成自然语言,为此对该学科的研究一直都在探索和尝试各种语言模型和处理机制来实现对语言的计算。按其处理思路的不同,目前的自然语言处理研究可以被划分为基于规则的理性主义和基于统计经验主义两大流派。但是,随着信息化社会的迅猛发展,信息处理尤其是语言文本的处理对自然语言处理的研究和应用提出了更高的要求。而目前的各种处理方法都仅仅是停留在语形的处理层面,成为提高处理精度和实现语言理解的瓶颈。所以,许多研究者开始考虑在处理过程中引入语言理解过程中必不可少的语义分析,并为此探索对于语义知识的抽象和整合表达,展开了以面向自然语言处理的语义知识库的构建的研究,有关知识库构建的知识工程已成为一个全新的热门课题。然而,在构建语义知识库的研究过程中,由于缺乏对语言在计算模式下的理解的准确定义,以及语义知识的准确抽象,只是盲目地借鉴语义学的研究成果来设计知识的结构和组织形式,从而导致定义的语义知识混杂着语法规则,构建的知识库与计算机的计算需求间的耦合性不佳,语义知识零散孤立的状态。另外,现有的知识库的构建方法,其知识单位节点的获取大部分依靠专家的人工编辑,这种做法脱离了语言的真实语用环境,也存在着完备性的缺陷。综上所述,本文首先深入分析了人类语言理解的过程,抽象出语言理解的核心语义知识的结构,提出一套以实体-属性-框架词汇级知识和情景描述框架为主体的语义知识体系。为优先构建实体-属性-框架的词汇级知识库,我们按照人类认识世界的方式分领域进行,以真实的语料为基础使用计算机辅助抽取知识资源。并以电脑领域为例,讨论了使用当前的自然语言处理相关技术自动获取实体的属性知识以及描述关系的搭配框架知识的方法,构建出该领域的一定规模的实体属性框架语义知识资源样例。这些方法不仅在实验中验证了其良好的辅助功效,同时还可以被推广到其他领域的实体-属性-框架知识的构建中。