论文部分内容阅读
在自然语言处理中,语义分析一直是研究的难点。它需要语法分析、知识表示等方面的技术支持,同时需要考虑到语言学、心理学、哲学等方面的理论指导。它的研究成果对于自然语言处理中的许多应用领域具有重要的理论和实践意义,包括信息检索、机器学习、文本生成和自动问答等。本文主要是在研究语义分析的基础上,建立了一个具有自动问答功能的系统。论文主要从以下几个方面作了重点研究和创新。首先,对国内外研究现状进行了分析,提出了本课题研究的对象及目的。论文着眼于对汉语真实文本进行语义分析,来模拟人类从语言中获取知识和使用知识的过程。其次,在知识表示和推理方面进行了研究。根据汉语语义的特点扩充了概念图的知识表示方法,实现了在概念图基础上的语义计算功能。并且对汉语语法关系到语义关系的转化规律进行了研究,总结了一套转化规则。再次,设计并实现了基于语义的自动问答系统,并构造了学习知识和使用知识的模型。该系统主要包括六大模块,分别为:句法分析及预处理模块、语法图到概念图转化模块、概念图显示及修改模块、问题概念图的生成模块、概念图的检索模块和结果输出模块。句法分析及预处理模块主要采用了哈工大的LTP 2.0系统,实现文本的自动切分和标注,提取出隐藏于文本中的语法结构信息。语法图到概念图转化模块是本文研究的一个重点,通过统计24种依存语法关系类型与49种语义关系之间的对应规律,本文提出了一套语法到语义的转化规则。通过这些规则就可以把所有的依存关系转化为相对应的语义关系,直接在概念图中进行使用。概念图显示及修改模块主要是为了提高系统的精度,提供了一个对初始概念图进行修正的功能。问题概念图的生成模块是针对用户的问题进行分析,把问题也转化为相对应的结构,从而可以从知识库中检索答案。最后的结果输出模块是负责把检索到的信息转化成自然语言的方式反馈给用户,这里使用了字符串和语音两种形式。最后,给出了本系统的评测结果。通过对现实文本的分析和评测,显示出本系统对知识的学习和问题的分析方面具有很好的性能,特别是通过问题扩展在召回率上具有良好的表现。