基于目标指称文本抽取的中文多轮对话改写方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ewenxj860411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多轮人机对话场景下,用户对话常存在指代或信息省略的问题,给对话系统准确识别用户意图造成了巨大困难。为此,研究者提出使用序列到序列模型,利用历史对话信息,将存在指代或信息省略的当前对话改写成完整且无歧义的对话。这类模型在对话改写中实际有两个任务:1)从历史对话中抽取能补全当前对话语义信息的文本。2)利用该文本辅助生成改写对话。通过对现有数据集的分析,本课题发现,历史对话中只有一小部分文本影响当前对话的改写。因此,当历史对话序列较长时,仅使用序列到序列模型可能无法捕捉到历史对话中的关键信息,导致对话改写效果下降。为了解决上述问题,本课题把历史对话中影响当前对话改写的一段连续文本称为目标指称文本,提出基于目标指称文本抽取的对话改写方法。本课题的主要工作如下:1)先使用抽取式机器阅读理解模型从历史对话中抽取出目标指称文本,再将目标指称文本、历史对话、当前对话一起输入序列到序列模型生成改写对话。这种显式将目标指称文本作为输入的做法突出了目标指称文本的重要性。2)考虑到历史对话、当前对话、目标指称文本在对话改写任务中拥有不同的重要性,本课题的对话改写模型会分别在这三类文本上生成词概率分布,同时利用注意力机制生成文本权重对词概率分布加权。这样做的好处有两个:第一,对话改写模型通过注意力机制,能为目标指称文本分配适合的权重,增加模型的鲁棒性,避免模型在目标指称文本抽取不准的情况下,生成错误的改写对话。第二,若用户当前对话语义完整,无需改写,模型应该给予当前对话文本更高的权重,使得在生成改写对话的过程中,当前对话的文本有更多的可能被选择作为输出。为了验证模型的有效性,本课题在两个公开的中文对话改写数据集上进行了实验。实验结果表明,基于目标指称文本抽取的模型能够捕捉到历史对话中有效的语义文本,提升了对话改写模型的性能,最终效果优于所有的对比模型。
其他文献
从大量的生物医学电子文本中自动抽取其中实体之间的关系,对生物医学应用例如生物医学知识图谱的构建,生物医学知识发现等等具有十分重要的意义。随着深度学习、自然语言处理技术的发展,关系自动抽取技术也取得了长足的进步。然而生物医学文本中存在的专业性词汇,实体在句子中的较大跨度,以及句子中混杂的大量无用信息,仍为医学关系抽取带来重大挑战。本文从结合文本序列信息和句法依赖信息的角度出发,通过借助句法结构信息来
基于行人的多目标跟踪算法在视频分析、智能安防中有着广泛的应用。但跟踪算法只能提供跟踪目标的边界框表示,而在行人姿态识别、视频编辑等更复杂的任务中,往往不能满足于边界框表示,还需要分割算法分割出精确的目标边缘,从而对跟踪目标做更精细的处理。现有的联合实例分割与多目标跟踪的算法较少,且计算量较大,部署困难。因此本文立足于算法的落地部署,采用轻量型网络结构将目标检测、实例分割和多目标跟踪三个任务集成于单
基于图像的三维重建算法在计算机图形学和视觉相关的各项任务中,例如自动驾驶,虚拟现实以及增强现实等,都发挥着十分重要的基础性作用。长期以来,传统算法主要利用基于多视图几何的立体对应实现三维重建,然而这类算法的重建结果往往受限于输入图片对于视角的覆盖范围。而随着深度学习技术的飞速发展,从单张图片重建目标物体的三维模型这一具有挑战性的任务具有了可行性。最近一系列基于深度学习的三维重建算法被提出,其中目标
碳钢冷凝器是一种常见的管壳式换热器类型,通常以水或空气为冷却剂来去除热量,广泛应用于石油、制冷、动力及冶金等领域。由于水的制冷能力较大,且间冷开式循环冷却水系统相较于直冷开式循环冷却水系统耗水量小,与我国节约用水的原则相一致,工业中常优先采用间冷开式循环冷却水系统,因此对基于间冷开式循环冷却水系统的碳钢冷凝器展开研究具有十分重要的工程意义。目前碳钢冷凝器正逐步向高温高压、大型化的方向发展,间冷开式
在20世纪末期,香港现代建筑因城市快速发展引致被改造及面临拆除的威胁,社会开始注意到保护现代建筑的重要性,至21世纪初期现代建筑保护成为香港保育事业的重要议题之一。为了实现社会环境的可持续发展,我们有必要研究香港现代建筑遗产的保育活化。目前,香港有数个现代建筑保育活化的案例,均取得良好成果。本论文通过对香港的历史建筑保护制度和保育现代建筑的工作实践深入阐释,探讨了香港保护现代建筑的保育方法,并希望
随着机器人技术的不断发展,机器人作业环境由传统的工业工厂延伸到人们的日常生活服务以及康复保健中来,如医疗机器人、按摩机器人、护理机器人等,这些机器人往往与人体肌肤直接进行接触作业,因此机器人的安全性问题受到了越来越多的重视。为保证作业过程中的安全性,需要获取作业区域实时的三维信息,并同时对作业过程进行风险评估。本课题以面部作业机器人为研究对象,研究了面部轮廓三维信息获取、跟踪定位和作业中动态风险评
织物瑕疵检测是纺织品生产过程中的重要一环,织物瑕疵是影响织物品质的重要因素。目前,织物瑕疵主要依靠检测人员借助简单的工具来完成,这种传统检测手段完全依赖人工经验,识别效率与准确度已经逐渐不能满足企业自动化、智能化的生产需求。随着计算机技术与机器视觉、图像处理技术的不断进步,为了改善劳动力生产环境、提高生产效率、降低生产成本,在织物工业生产中的瑕疵检测阶段采用瑕疵自动识别技术是必然趋势。本文主要从纹
目前我国正处于从城市扩张向城市更新转变的重要节点,城市发展空间日趋饱和,可新增建设用地愈发有限,而对历史文化街区的保护与更新正是存量时代下城市更新的重要组成部分。然而,作为历史文化街区各种社会活动重要载体的街道空间,却因为“空心化”、“商改仓”以及“拆旧建新”等普遍存在且最为突出的现实问题,导致了街道活力日趋衰退。另一方面,居民多数迁出、建筑批量拆改、功能全面置换的更新方式,虽然在一定程度上遏制了
RAP(Reclaimed Asphalt Pavement)料的再生利用对于建设资源节约型和环境友好型交通运输业具有积极意义,在提高RAP料利用率的同时,改善当前再生料材料设计结果与实际性能偏差较大的问题,是当前的重要研究内容。RAP料作为再生料重要组成部分,可能来自同一项目的不同标段,或同一标段的不同结构层,即便是同一结构层也可能会有不同养护工艺施工材料差异等,其来源的复杂性必然导致冷再生材料
在新时代以建设海洋强国为发展战略的背景下,海洋文明的挖掘与海洋文化多样性的保护无疑成了重点议题。疍民,作为一支特殊的水上族群,对海洋的探索极大地丰富了中原文明之外的海洋想象,长期的海洋实践建构了疍民独特的族群文化,是我国海洋文明建设的重要力量。随着城市化的推进,居住于沿河海地区的疍民,其文化最先受到现代化与全球化的冲击,许多独特的海洋文化现象因失去发展的根基与土壤而遭到破坏,很大程度上削弱了海洋文