基于模式匹配的中文问答技术研究

来源 :沈阳航空工业学院 沈阳航空航天大学 | 被引量 : 3次 | 上传用户:programmelove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答技术是自然语言处理领域中一个热门研究方向,它综合运用了各种自然语言处理技术,目前国内外有很多的科研机构都参与了该技术的研究。基于模式匹配的自动问答技术是一种很有效的自动问答技术,它在TREC会议上取得了较好的成绩,于是引起了学术界的广泛关注。 目前,国内外很多的科研机构都在进行着将基于模式匹配的自动问答技术应用于英文处理的研究,而研究将该技术应用于中文处理的科研机构却寥寥无几。本文正是对该技术进行的探索性研究。本文从以下两个方面来介绍基于模式匹配的中文自动问答技术:模式学习技术和答案查询技术。 模式学习技术是基于模式匹配的中文自动问答技术的核心技术,它用于解决在离线状态下如何自动获取某种问题类型的答案模式以及如何计算答案模式精度的问题。本文利用后缀树作为模式获取工具来获取答案模式的。由于答案模式的精度对答案查询技术有着重要的影响,本文参照传统的正确率计算模型,提出了一种改进的答案模式精度计算模型,该模型考虑了答案类型因素对计算答案模式精度的影响。本文分别在传统和改进两种答案模式精度计算模型下进行了答案查询实验,并进行了结果分析,实验结果表明本文提出的答案模式精度计算模型达到了预期的效果。 答案查询技术用于分析处理用户使用自然语言方式提问的问题,并将问题答案直接返回给用户。该技术包括三个主要的组成部分:问题分析、信息检索和答案抽取。在基于模式匹配的中文自动问答技术中,问题分析包括:问题分类、提取问题词、提取关键词以及扩展关键词。本文采用了基于问题模板的问题分析技术来分析用户提出的问题,以理解用户问题的意思。信息检索则是要从互联网检索出和用户问题相关的文档。由于目前信息检索技术相对比较成熟,所以本文采用了直接调用现有搜索引擎的方法。答案抽取则是利用答案模式从相关文档中抽取候选答案,计算候选答案可信度,为候选答案排序,并依次提取出几个可信度较大的候选答案返回给用户。 在本文的最后,还对基于模式匹配的中文自动问答技术进行了系统实现。
其他文献
随着瓦联网应用的普及,人们希望能够使用更为丰富和先进的即时通信技术,来改进通信效率,提高协作能力。其中将多媒体通信引入即时通信是主要的应用之一。本文主要探讨了基于XMPP
多年的信息化建设使组织机构内部同时运行了众多异构的OLTP系统,并积累了大量历史数据。为能向管理者提供全局一致的信息视图,并满足不同层次用户的分析需求,出现了DB-ODS-DW三
本文针对无线网络的语音、视频传输业务中,时延、带宽、丢包率等问题,以及主干网带宽变大后,接入部分的无线网络带宽资源相对较小,造成的无线接入部分成为整个网络中端到端连接服
在过去的二十年中,计算机网络经历了爆炸式的增长,随之而来的是越来越严重的拥塞问题。拥塞控制是确保Internet鲁棒性的关键因素,也是其它服务质量机制正常工作的必要前提,因
网格技术发源于科学研究领域,主要通过计算资源协同、数据资源协同及信息资源协同,构建网格虚拟环境,解决科学计算中的各种问题。随着网格技术与Web服务技术的融合,网格上的资源
在当今这个信息爆炸的时代,随着信息的数字化处理程度的提高,从大量数据中挖掘有用信息的需求日益增加,从而大大推动了数据挖掘的发展。然而,任何事情都有其两面性,在数据挖掘领域
近年来,无人机技术得到了长足的发展,利用无人机平台获取高分辨率航拍图像数据作为一项空间数据获取的重要手段,具有成本低、机动灵活、能够在高危地区探测等优点。但是无人
JAVA EE是当前最为主流的企业应用体系架构之一,其多层设计思路与开放的体系为企业应用的设计开发与维护提供了巨大支持,且在持久层,业务层,逻辑层等各层均出现了非常成熟的
P2P(Peer to Peer)技术是近年被业界广泛重视并迅速发展的一项技术,它是现代网络技术和分布式计算技术相结合的产物。P2P技术应用到Internet,揭开了现代对等互联网的序幕。与基
随着计算机技术的发展和高校信息化工作的不断推进,教育信息化完成了基础设施的建设,高校内拥有越来越多的应用系统。这些应用系统采用了不同的数据库系统或多种数据存储方式,存