论文部分内容阅读
问答系统为人们提供了自然语言的人机交互方式,相对于传统的关键词方式搜索引擎来说,其具有显著的优势。在受限域,基于常问问答库的问答系统在对问题答案的定位上,有更准确,快捷和高效的特点,在日常生活的各个领域,有着非常重要的应用前景,是当前研究的热点问题。本文围绕受限域FAQ汉语问答系统实现过程中的领域知识库构建,受限域FAQ的收集和组织,问句分类,相似问句的查找及答案提取等关键核心技术进行了一系列的研究和探讨,主要取得了以下较有特色的成果:(1)提出了在受限域中,构建“领域知网”知识库的方法。该方法利用领域知识的特点,借助本体思想与“知网”知识资源,构建了领域知识库,实现与常识知识库“知网”融合,领域知识库与常识知识库的结合为自然语言处理方面的研究提供了更有效的资源。(2)提出了一种利用领域知识特点来收集、组织和归类FAQ的方法。该方法在分析旅游领域知识特点的基础上,根据地域及问题类型等特征,实现了FAQ的收集和组织。(3)提出了一种基于规则的领域问句分类与识别的方法。该方法利用问句语言规则与领域知识特点提取问句类别规则,基于规则来进行问句分类与识别。该方法能够有效的缩小候选问题查找范围,提高答案定位的准确率。(4)提出了一种利用领域知识特点的语义依存的问句相似度计算方法。该方法利用领域问题特点,提取问题类别,根据类别进行相似问题过滤,以“知网”及“领域知网”知识库为基础,采用句法分析提取问句有效依存对,利用依存对和概念语义关系,实现问句之间相似度计算。(5)在云南旅游领域,设计实现了云南旅游问答原型系统。构建了领域知识库和领域FAQ数据库,采用文中问句相似度计算方法,进行问句相似度的计算,实现问题答案提取。云南旅游FAQ问答原型系统测试结果表明该方法可行,有较好的效果。