论文部分内容阅读
问答系统是一种帮助人们获取信息与知识的人机合作系统,它可以接受用户以自然语言的形式提出问题,据此在知识库中搜索问题的答案,并以简洁准确的自然语言将答案返回给用户。问答系统是人工智能研究的一个重要领域,涉及到信息科学、人工智能、知识工程、自然语言理解、机器学习、语言学等众多领域,具有重要的学术意义和实际应用价值。问答系统需要研究的问题很多,而信息是最核心的问题:如何准确理解用户所提问题的信息需求(目的)?如何准确理解知识库的知识(它是一种高级信息)?如何合理地表达和组织知识库的知识?如何准确判断用户问题信息与知识库知识信息之间的匹配状况?如何以自然语言形式表达答案?等等。影响问答系统性能的关键是对信息的利用是否充分。本文拟针对目前问答系统研究中直接与信息相关的两个重要问题展开研究:(1)以往的系统未能全面深入地描述和理解问答过程中的信息,表现在:关注了语法和语义信息的研究,几乎没有关注语用信息的研究,更没有关注语法、语义、语用信息之间的关联研究,影响了对信息的理解。(2)对于问答过程中各个模块相互作用的研究不够深入,尤其对如何利用用户反馈信息来改善问答系统质量的研究不够充分。为此,本文将首次引入语法信息、语义信息、语用信息三位一体的“全信息理论”来研究问答系统,期望为逐步解决上述两个问题提供新的思路和实现技术。本文的具体创新如下:第一,基于全信息理论将语用信息引入问答系统的研究。目前问答系统研究中缺少对语用信息的关注。针对这一问题,本文在全信息理论的指导下将语用信息引入到问答系统当中,并提出了问答系统中分析语用信息的六个要素。这六个要素分别是(1)语用信息的主体;(2)问答过程中所使用的语言符号;(3)知识库;(4)用户的意图;(5)问答的语境;(6)问答的实际的效果。根据这些要素可以较好地确定用户目的和针对用户目的语用信息。语用信息的引入使得问答系统能够更全面地理解用户的信息需求,更准确地判断答案是否满足用户的信息需求。第二,利用奥斯汀“语言行为分析”的方法来获取问答过程中的用户目的和语用信息。语言行为分析语言的言外之意,即语言的目的。本文提出了针对问答系统的二层语言行为的分类标准,以便更好地获取用户的目标;通过对知识库中各种语句的语言行为分析,判断这些语句是否满足用户的目标要求。第三,改进语法信息、语义信息和语用信息的融合。由于目前获取语用信息的方法还不是尽善尽美,由此产生的语义信息也必然不够完善。为了弥补这些不足,本文将语法信息、语义信息和语用信息进行融合,以便更充分地挖掘它们之间的联系。同时,采用排序学习等统计学习方法,利用融合的全信息获取统计学习的特征,从而改善了答案的质量。第四,设计一个实用的《论语》问答系统。该系统有以下两个特点:第一,可以扩展问答系统的知识来源,从单一的语料库文档扩展到结构化知识以及问题答案对,这样问答系统掌握了多种类型的知识,有助于问答系统回答问题,而且问答系统还具有在问答的过程中积累知识的能力。第二,增加问答系统和用户的交互。在问答过程中用户和问答系统多回合的交互能够提供更加丰富的语用信息,从而更准确地回答用户问题。实验表明,本文上述尝试都达到了改善问答系统效果的目标,证明本文所提出的思路是正确的,而且是有效的,实现技术是可行的。然而,由于信息的表示和问题的理解十分复杂,本文提出的具体实现技术还存在进一步改进和完善的空间。