客服机器人拒绝识别任务研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:3pei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垂直领域客服机器人在服务的过程中经常遇到需要拒绝识别的场景,指的是机器人由于知识库局限不能正确回答的情况。相比“答非所问”,客服机器人拒绝识别再转由人工接手更能获得用户信赖。对于拒绝识别任务,早期传统的解决办法是基于规则,例如敏感词识别,这需要大量的专家知识且不具有迁移性。近年来随着深度学习的广泛应用,自然语言处理任务采用神经网络作为编码器提取文本特征,再转而用机器学习算法进行处理。拒绝识别场景的相关研究工作包括可拒绝分类、异常值检测和文本开集识别等,这些算法大多也是基于神经网络的特征编码构成两段式混合模型框架,无法通过优化任务相关的目标函数影响文本特征的表示学习。针对上述问题,本文提出了基于最大间隔平方铰链损失的循环神经网络来实现客服机器人的拒绝识别。首先根据用户问句短文本的特征,提出了基于双向GRU和注意力机制的句向量编码模型,用分类任务进行有监督的文本特征提取,在闭集上实现了95%的分类准确率,说明该编码器模型结构能良好地对文本数据建模,继而以此结构为基础实现深度拒识模型。由于测试集中有训练集未见的新类,分类模型输出层中softmax激活函数的归一化会导致新类概率为0,因此替换为sigmoid函数并实现了多分类问题中的“一对其余”策略;受单分类支持向量机目标函数用于深度异常值检测算法的启发,采用最大间隔平方铰链损失取代循环神经网络中的交叉熵,实现了基于最大间隔动机的文本特征提取,并且模型在收敛速度上有较大提升;最后根据正态分布的3σ原则设计了拒绝识别的概率阈值选取方法。相比基线方法,这种端到端的拒识模型在可见类更少的场景下性能提升了2.24倍。
其他文献
探地雷达作为一种快速无损的地球物理探测手段,已经被成功应用于许多领域。它通过发射高频电磁波进入地下介质,在遇到介质特性差异较大的界面发生反射,从而实现对地下目标的
近年来,光纤传感系统受到越来越多的关注,与传统的电学传感系统相比,光纤传感系统抗电磁干扰能力强,体积小,重量轻,机械性能好,并对温度、湿度、压强等外界条件的变化更加灵
近三十年来,多带小波的一般理论逐渐趋于成熟,但是M-带线性相位正交小波的设计仍然是非常困难的,尤其是当多带小波的带数较大的时候.本文主要研究了两类六-带线性相位正交滤
作为各种元器件的载体与电路信号传输的枢纽,印刷电路板(Printed circuit board,PCB)已经成为电子信息产品的关键部分。近年来,柔性电路(Flexible printed circuit,FPC)的研
否定是存在于所有语言中一种复杂的语言现象,能对句子或词语包含的语义信息进行反转。越来越多的自然语言处理任务需要从文本信息中挖掘出有价值的信息,否定的存在将会导致挖
微多普勒效应是由于目标各部件发生除了主体平动之外的转动、振动等运动所带来的对雷达回波调制效应的统称。通过分析信号,能够得到目标的微多普勒特征,微多普勒特征携带了目
随着自动驾驶技术的逐步落地,层出不穷的问题显现出来。自动驾驶汽车搭载着众多昂贵的传感器,仅仅是为了能够实现信息冗余,从而提高驾驶的安全性。然而,提高驾驶安全性单从传
LED以其电光效率高、体积小、坚固耐用、易维护、节能环保等显著优点成为公认的下一代照明光源,其中,高性能白光LED的实现是重中之重。目前,红色荧光粉相比蓝、绿荧光粉而言
LAMOST的整个系统对光纤定位单元的定位精度要求较高,部分单元很难一次性达到准确的定位精度,需要通过高精度测量系统快速检测出光纤当前位置距离目标位置的差距,经过闭环系
海胆属于棘皮动物门(Echinodermata),海胆纲(Echinoidea),我国约有100多种,但大部分不能食用,能食用的10余种中最常见的是以下三类:光棘球海胆(也称大连紫海胆)、紫海胆、马