基于深度学习和强化学习的对话模型研究

来源 :北京科技大学 | 被引量 : 1次 | 上传用户:FishGWDC
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话系统目前已经成为人机交互最常见的方式之一,相较于其他的交互方式对话具有更加自然和便捷的优势。对话系统能够和人用最简单的语言进行沟通,不需要用户具备任何专业知识。并且对话的形式能够让用户解放双手,因此几乎适用于任何场景,同时由于语言是人类进行交流的最基本方式,也使得具备对话功能的系统在使用中显得更加友好。目前对话系统已经应用于例如智能音箱、语音助手、智能客服、虚拟人物等领域。因此,一个具备优秀语义理解能力和大量知识的对话系统有着广阔的发展前景。经过学术界数十年的研究,对话技术已经有了巨大的发展,在商业领域也已经取得了广泛地应用。现有的对话系统在语义理解、人格一致性、融合知识甚至模型本身都还存在大量不足,这些不足也是我们探索此领域的动力。目前,对话系统在商业应用时会采用大量工程化的手段解决上述问题,而学术界期望采用更低成本更加智能的方法使现有对话系统更加智能和易用。所以利用强化学习和深度学习技术让对话系统智能化是一个非常有挑战性又亟待解决的方向。本文不仅利用深度学习技术改进对话系统,也尝试研究如何利用强化学习提升对话效果。本工作针对对话系统的一致性、模型结构、语义理解和知识融合四个方面开展研究,主要工作和创新点如下:(1)为了解决开放域对话中神经网络生成的回复缺乏人格一致性的问题,本文提出了一个融合注意力检索机制的对话模型。模型利用注意力检索机制从外部设定的人物背景信息表中获取合适的信息;为了进一步提高模型检索正确信息的效果,本工作采用一种两阶段的训练方法,利用普通对话数据进行模型预训练,再利用包含人物信息的对话数据对模型进行微调。在微博语料上的实验结果表明,提出的模型相较于其他生成模型,生成的回复中包含人物信息的准确率有较大的提高。(2)针对生成模型的暴露误差(exposure bias)问题以及生成词语时存在“短视”的问题,本文提出了一种融合继承特征的神经网络生成模型。模型包含两个部分,一个是可以输出词语概率分布的序列生成网络,另一个是可以预测未来整句回报的评价网络。其中,评价网络利用深度继承特征能够评估当前生成的词语对整句话的影响,因此该模型不仅能够像其他生成模型一样考虑当前词语的最优解,还能考虑未来生成整句的最优解。通过在德语到英语和英语到越南语的翻译任务上进行实验,证明了所提出模型相比基线模型在BLEU得分以及鲁棒性上都有较大提高。(3)针对意图识别(Intent Detection,ID)和槽值提取(Slot Filling,SF)联合模型共享语义信息不够充分以及需要手工设置权重参数的问题,本文提出了一个具有长度可变注意力机制的语义理解模型。首先设计了一种新的标签方案将两个任务统一为一个序列标注任务。然后,提出了一个长度可变的注意力机制,它可以选择性地提取序列标注模型中源句子的子集参与注意力向量的计算,从而能够节约计算资源并提高模型的准确率。在ATIS和DSCT5数据集上的实验结果表明,所提出的模型在识别和提取的准确率方面优于其他对比模型。说明此方法能够自动找到两个任务之间的平衡,获得更好的整体性能。(4)为了将知识图谱融合进对话过程当中,让背景知识参与回复生成的过程,本文提出了一种结合强化学习方法和Transformer网络的对话模型。该模型分为两个部分,知识决策和回复生成。其中知识决策部分的作用是利用强化学习的决策能力从图谱中选择知识;回复生成部分的作用是利用决策出来的背景知识结合上下文和输入语句生成流畅且信息丰富的回复。本工作将模型应用于需要进行话题引导的聊天对话任务中,实验结果表明提出的模型在选择合适背景知识的准确率以及BELU指标上都有较大提高。
其他文献
目的探讨输尿管硬镜钬激光碎石治疗输尿管上段结石的效果。方法选取2014年~2017年在我院治疗的输尿管上段结石患者108例作为研究对象,进行回顾性分析。结果手术成功率为96.7%
采用不同浓度乙醇提取大蒜油,比较其大蒜素含量差异,并结合大蒜油与大蒜渣中粗蛋白、可溶性糖、脂肪、钙、铁和锌的含量,筛选出效果较好的大蒜油提取工艺.
针对电厂循环水排污水处理用反渗透系统长期运行后出现的污染问题,通过反渗透试验对反渗透系统污染物成分进行分析,得出反渗透系统的污染物主要为硫酸钙垢,并采用新的"盐酸+
邻苯二甲酸酯(Phthalic acid easters,PAEs)被大量用于塑料的增塑剂和软化剂,由于加工助剂、淋膜材料、油墨、再生纸浆等材料的引入,导致纸基食品接触材料可能有增塑剂类有害物质溶出并迁移到食物中,造成食品安全隐患。本学位论文针对纸基食品接触材料中邻苯二甲酸酯增塑剂的迁移特征开展研究,包括以下三部分内容:(1)利用气相色谱-质谱法测定了 23种PAEs,在优化的色谱质谱条件实现了
目的:运用网络药理学分析与动物实验验证关键核心靶点探究舒血宁注射液(Shuxuening injection,SXNI)治疗缺血性脑卒中(Ischemic stroke,IS)的作用机制。方法:一、网络药理学部分:1.通过TCMSP,TCMID,Batman-TCM三种中药数据库查询银杏叶的化学成分,按照DL≥0.18,OB≥30%的筛选条件初步确定银杏叶的活性成分。运用TCMSP数据库、STIT
目的探讨初诊多发性骨髓瘤患者凝血指标的变化及意义。方法回顾性分析2008年10月—2012年10月中国医科大学附属第一医院血液科收治的初诊多发性骨髓瘤患者96例,检测凝血酶原
目的探究根管治疗和冠修复对牙隐裂伴牙髓病变患者的临床疗效。方法方便选取2016年3月—2017年3月来该院治疗的牙隐裂伴牙髓病患者120例,患牙120颗。随机分为对照组和观察组,
主要介绍了一种利用Matlab Simulink和Quartus II Dspbuilder进行数字射频上变频系统的设计方法,并给出了设计方案、仿真结果以及硬件测试结果。本设计基于软件无线电构架,通
随着我国人口老龄化的加剧,社会对长期护理的需求急剧增加,开办长期护理保险在我国势在必行。根据我国实际情况,借鉴国外先进经验分析我国长期护理保险发展的合理途径,具有深
加拿大玛嘉烈医院癌症中心的临床研究人员发现,未成熟祖细胞的耐药性是导致多发性骨髓瘤复发的根本原因。此项研究成果发表在近期的《癌细胞》杂志网络版上研究表明,使用蛋白