论文部分内容阅读
使机器拥有自然语言交流能力是人工智能的终极目标之一,自图灵测试被提出以来,机器的对话能力也一直被当作衡量系统智能程度的标准。近年来,对话系统更是成为人工智能在商业领域的热点,各种对话系统纷纷发布并,如苹果的Siri,微软的Cortana和小冰,小i和图灵等等。尽管数十年来,NLP与AI研究在语音识别、语音合成、机器翻译、信息检索、浅层语义、情感分析等领域取得巨大进展,但对应用于对话系统的认知对话管理、语义语用等深层理解领域仍没有根本性的突破。即使目前表现最好的对话系统,也仍然依赖于表层的语言分析和简单的启发性知识,而不考虑语义和语用等信息,因此其表现仍然与人类的对话表现有巨大差异。构建一个人类水准的对话系统是一项艰巨而长远的任务,其深度和内容都已经远超本文所能涵盖的范围。本文针对当前对话系统中的认知技术研究的不足,深入研究了认知对话系统中所需涉及的认知技术的范畴,在这些认知需求的基础上提出了一个动机驱动的认知对话控制模型,我们认为,一个自然的人机对话系统,必须遵循以下四个原则:知识深层表示、不确定性逻辑推理、语言与涉身知识的融合以及动机驱动的对话控制。在知识深层表示方面,针对传统对话系统中知识表示的不足所引起的表达能力和计算效率问题,本文使用了一个基于超图的知识表示体系,该体系既能储存丰富复杂的语义信息且能灵活操作。在该知识表示体系的基础上,本文设计和实现了能将自然语言转换成基于该表示的语义逻辑形式的自然语言理解框架,使得该对话系统能够从自然语言中获取浅层的句法信息之外的深层语义信息,并用于对话认知过程中;此外,本文还设计并实现了一个基于超图匹配的将抽象的语义超图表示转换成自然语言的表层生成框架。在不确定性逻辑推理方面,鉴于能进行自然的人机对话的系统必须具备对不确定性知识的处理能力和在非精确条件下推理和决策控制的能力,本文在概率逻辑网络的逻辑架构上应用不确定性逻辑推理,实现了在自然语言语句上执行概率性常识推理,使得人机对话过程中系统能借助常识来理解模糊或不确定的输入。在语言与涉身知识的融合方面,鉴于语言的交互不仅仅是语言层面上的交互,还需要理解语言背后涉及到的涉身交互,本文以言语行为理论作为指导,将对话中的每一句话语看成是成一个“言语行为”,即包含一些独特的语言属性,还包含一些涉及到言语行为和其他类型行为的语用属性,即“言外之意”,从而将语言和涉身知识融合并将言语所对应的行为类型作为对话策略的选择依据之一。在动机驱动的对话控制方面,鉴于目前的对话系统中大多使用基于简单的浅层语言信息提示来回应用户输入,本文认为认知对话系统应该具备一个动机系统,使得对话过程能够按照系统本身的动机出发来完成认知型的智能对话,而不仅仅作为“执行主体”来完成用户指派的任务,因此本文引入了心理学上知名的动机驱动的情感评估模型Psi,并改进该模型使其更适合用于认知对话系统中,通过动机驱动的模型来组织和管理对话,使得对话过程中系统能根据其当前的状态和动机来选择最合适的对话行为作为应答。本文着眼于未来对话系统中认知技术的发展,提出了一个全新的动机驱动的认知对话系统模型,并以言语行为理论作为指导将语言和涉身知识融合起来使得对话过程更拟人更自然。本文对对话系统的认知技术进行了深入研究和有效的探索,为实现更逼真更自然的对话系统奠定了一定的基础。