基于概念图的中文语义分析系统的研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:jenniechen007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理中,语义分析一直是研究的难点。它需要语法分析、知识表示等方面的技术支持,同时需要考虑到语言学、心理学、哲学等方面的理论指导。它的研究成果对于自然语言处理中的许多应用领域具有重要的理论和实践意义,包括信息检索、机器学习、文本生成和自动问答等。本文主要是在研究语义分析的基础上,建立了一个具有自动问答功能的系统。论文主要从以下几个方面作了重点研究和创新。首先,对国内外研究现状进行了分析,提出了本课题研究的对象及目的。论文着眼于对汉语真实文本进行语义分析,来模拟人类从语言中获取知识和使用知识的过程。其次,在知识表示和推理方面进行了研究。根据汉语语义的特点扩充了概念图的知识表示方法,实现了在概念图基础上的语义计算功能。并且对汉语语法关系到语义关系的转化规律进行了研究,总结了一套转化规则。再次,设计并实现了基于语义的自动问答系统,并构造了学习知识和使用知识的模型。该系统主要包括六大模块,分别为:句法分析及预处理模块、语法图到概念图转化模块、概念图显示及修改模块、问题概念图的生成模块、概念图的检索模块和结果输出模块。句法分析及预处理模块主要采用了哈工大的LTP 2.0系统,实现文本的自动切分和标注,提取出隐藏于文本中的语法结构信息。语法图到概念图转化模块是本文研究的一个重点,通过统计24种依存语法关系类型与49种语义关系之间的对应规律,本文提出了一套语法到语义的转化规则。通过这些规则就可以把所有的依存关系转化为相对应的语义关系,直接在概念图中进行使用。概念图显示及修改模块主要是为了提高系统的精度,提供了一个对初始概念图进行修正的功能。问题概念图的生成模块是针对用户的问题进行分析,把问题也转化为相对应的结构,从而可以从知识库中检索答案。最后的结果输出模块是负责把检索到的信息转化成自然语言的方式反馈给用户,这里使用了字符串和语音两种形式。最后,给出了本系统的评测结果。通过对现实文本的分析和评测,显示出本系统对知识的学习和问题的分析方面具有很好的性能,特别是通过问题扩展在召回率上具有良好的表现。
其他文献
研究发现,导致大型软件难于维护的重要原因之一在于软件代码中存在大量的相似代码。对于大型的企业应用软件,由于大量相似用户界面、相似业务逻辑的存在,势必导致了大量相似
随着互联网的迅速发展和普及,现代人们越来越偏向于使用E-learning系统进行学习。但是越来越多的学习资源充斥在整个网络中,学习者面对如此庞大的学习资源感到迷茫,不能准确
目前的计算机网络规模不断扩大,复杂性不断增加,异构程度以及对灵活性和可扩展性的要求也越来越高。在这种情况下,传统的SNMP网络管理逐步暴露出其基于管理者/代理者(Manager
机会网络的概念是在延迟容忍网络和移动自组织网络的基础上提出的一种不需要源节点和目的节点存在完整路径,依赖于节点间的相遇机会,实现通信的间断性网络。这种“存储-携带-转
汇编器有着悠久的历史,最早的汇编器诞生于1940年。作为计算机编译工具链中不可或缺的一部分,汇编器经历了长期的发展。汇编器的编写理论也随着汇编器的日益完善而逐步形成,
数据库系统存储的信息越来越重要,然而现代数据库系统不能避免所有针对数据库的攻击,怎样恢复遭受恶意攻击的数据库系统一直是数据库领域的一个重要研究课题。尽管数据库恢复
本文针对异构数据集成过程中的模式转换问题,提出一种XML模式与关系库模式的转化方法,通过定义XML Schema与关系模式之间的转换规则,以XML Schema文档树生成的结点树为基础,
信息技术的发展和Internet的全球普及,大大加快人们生活节奏,同时也增加了工作的流动性,传统的“固定办公桌”式的工作模式已不能满足人们的需要,移动办公的需求就越来越强烈。本
虚拟化技术的出现与实用化,不仅为提高服务器利用率、整合异构资源带来了新的解决方案,也为个人用户便捷、高效的使用桌面服务带来了新的机遇。桌面应用往往有较高的实时需求
当前各学科的虚拟教学实验系统的开发没有统一的标准,存在实现方法各异,扩展性差的问题。多领域统一建模方法为解决这个问题提供了很好的思路。然而,目前传统的多领域统一建