论文部分内容阅读
随着计算技术与人工智能技术的发展,口语对话系统得到了越来越广泛的应用,尤其是面向特定任务的口语对话系统,不仅可以随时随地为人们提供便捷的咨询服务,而且为人们的生活带来很多方便。作为对话系统的重要组成部分,口语理解通常涉及两个任务:意图识别和语义槽填充。传统的口语理解模块通常对两个任务分别进行处理,其中意图识别通常使用分类的方法将句子分到对应的意图类别中,语义槽填充则是对给定句子中的每个词分别进行序列标注。目前意图和语义槽填充联合识别成为口语理解研究的主流方法。基于此,本文针对呼和浩特市的公交领域,以问路语句作为实验数据,进行口语理解研究,旨在识别问路语句中的出发地和目的地作为语义槽填充,并对语句整体进行出行意图的判断,理解用户的出行需求。具体内容如下:(1)针对传统条件随机场(Conditional Random Field,CRF)模型不能设定意图标签的问题,采用一种将意图识别转化为序列标注任务的方法,通过为语句中的字或词增加一个标志位来表示意图,从而实现使用CRF模型进行意图和语义槽填充联合识别。(2)针对现有意图和语义槽填充联合识别方法没有很好地提取语义信息的问题,采用一种基于注意力机制(Attention mechanism)的双向长短时记忆网络(Bidirectional long short term memory,BLSTM)模型,不仅避免了RNN的梯度消失问题,而且在LSTM的基础上还能够获取到后向的语义信息,加入注意力机制后,可以更精确地获得所需的语义信息。实验结果表明,基于Attention机制的BLSTM模型在意图识别准确率和语义槽填充F1值上,其性能都优于LSTM、BLSTM、LSTM+Attention三种方法,并且在每种方法上基于字标记的结果优于基于词标记的结果;该模型与CRF联合识别模型进行对比,语义槽填充F1值高于CRF方法,意图识别准确率较低于CRF方法。总体而言,基于Attention机制的BLSTM模型取得了最优的结果。