基于GPT-2模型的生成式对话系统应用研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lookingintheeye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话技术无论是在学术界研究领域和工业界应用领域都受到学者青睐。传统的对话系统大多是基于数据库实现的,这些系统内置有回复语句,基于规则和检索因而响应速度迅速,在早些年很受工业界的青睐。然而,受限于数据库中答句数量与质量,其应用范围有限。随着深度学习技术与自然语言处理技术的发展,半监督的深度学习框架能够使对话主题和意图进行进一步地扩充,对话系统准确度、流畅性有一定提升。但依旧存在缺陷,如Transformer架构无法直接做到时序自回归,单向语言模型GPT-2在使用掩码语言建模(MLM)时,会将后面的序列掩码掉从而避免模型得到后面的信息,仅能依赖前面的词汇来预测后面的词汇,这使得该语言模型建模能力有所欠缺。并且原生GPT-2中使用的Transformer解码器的逻辑为采用基于输出的可能性最大化的Beam Search解码方法,其生成的文本存在语言平淡、连贯性差、语义重复等问题。针对以上问题,本研究着眼于取检索之长补生成之短,将检索式模型融入生成模型中,构建联合模型进行对话生成。通过向模型引入上下文背景信息,对语言建模能力尚有欠缺的问题进行改善,从而提升语言模型执行的任务的效率与质量。研究基于GPT-2改造两个模型,称为GPT2DH模型与GPT2LM模型。GPT2DH模型共有两个阶段,分别是语言建模和下一句子预测任务。以利用那些易于获取、数据量大开放域的无标注对话数据,训练的基于端到端结构的端到端对话系统。GPT2LM模型去掉了下一句子预测任务,采用GPT2的语言建模模块进行后端任务的迁移学习,目的在于解决容易生成式对话系统容易产生不可靠和无意义的回复的问题。同时GPT2DH模型在GPT2LM基础上还增加了一个分类的设计,分类任务则是用于预测系统生成的答句是否是问句的匹配答句,用于提升模型生成语句的准确性。对所构建的两个模型即GPT2DH及GPT2LM模型进行有效性评估;使用BLEU,ROUGE,困惑度等客观指标对生成的系统进行测试及分析。研究统计发现,GPT2DH模型与GPT2LM模型在三个语料库预训练后的答句评测数值都远高于基于信息检索的语言模型。模型的有效性评估结果表明GPT2DH及GPT2LM两个语言模型在BLUE、ROUGH指标上超过基于信息检索模型的5倍,是seq2seq模型的2倍。在困惑度指标上,是seq2seq模型的1倍。与自然语言生成中的SOTA模型BART进行对比分析,GPT2DH与GPT2LM模型在BLEU指标上1-4阶都相较于BART模型更高,所构造的GPT2DH与GPT2LM模型对话系统生成的语句与真实回复的语句相似性更高。在ROUGE的三阶指标上,也相较于BERT模型略高,这表明,构建的对话系统相对传统方法在对话准确性,回复的语句雷同比率降低等指标得到了提升。回复重复、逻辑混乱的问题得到了一定改善。最后,摘录了模型生成的语句中不合逻辑、答非所问的情况,对其分析并提供及相应的改进措施。
其他文献
随着世界经济一体化的发展,在“一带一路”倡议的倡导下,越来越多的中国企业参与到海外工程项目的建设中。而海外工程项目受业主方、分包商、公司内部及其他干系人的影响,具有高度的综合性和复杂性,因此具有较高的风险。自《招标法》颁布以来,大部分的国内外大型项目建设采用招标方式建设,而投标阶段作为整个项目建设的起始阶段,也是承包商迈入海外工程项目市场的第一步。因此,投标风险是整个项目建设过程中诸多风险的源头,
非物质文化遗产作为历史长河中的人文结晶,所蕴含的文化符号深具象征意义。秉承“非遗”传承的初心和使命,把非物质文化遗产的传承融进幼儿教育,从娃娃抓起,引导他们以亲身体验、参与互动的方式感受“非遗文化”魅力,树立其对家乡、民族、国家的文化认知和文化认同意识,是文化工作者肩负的责任和使命。为促进“非遗”文化传承活动在幼儿教育中的广泛开展,本文在对非物质文化遗产价值内涵加以辨析的基础上,以龙岩新罗区文化馆
<正>习近平总书记曾指出:“优秀传统文化是一个国家、一个民族传承和发展的根本,如果丢掉了,就割断了精神命脉。我们要善于把弘扬优秀传统文化和发展现实文化有机统一起来,紧密结合起来,在继承中发展,在发展中继承。”中华民族优秀的传统文化塑造了中华民族自强不息、厚德载物的精神品格。当下,要实现中华民族伟大复兴的中国梦,就应该做好优秀传统文化的传承与创新。学校是传承中华优秀传统文化的主阵地,
期刊
一个法律案件的裁判文书通常很长,而且法律术语很多,一般人很难理解,即使专业人士也要花许多时间才能理解。因此,有必要对法律案件的裁判文书进行总结。另一方面,近年来预训练的语言模型在许多自然语言处理任务中取得了优异的成绩。特别是GPT-2预训练语言模型擅长文本生成任务。司法裁判文书的自动摘要是一种文本生成任务。因此,本文提出了一种基于GPT-2的自动总结司法裁判文书的方法。具体来说,由于裁判文书很长,
为了解决建筑形式优美与技术低碳发展之间的不协调,以实际工程为例,采用结构形式优化、建筑选材、设备选型等技术策略,提高景观建筑的绿色性能。
期刊
从当前的社会经济发展格局来看,国家自然科学基金的设立、运行与发展是科研竞争机制与科学研究结合的必然选择,不仅能够推动我国科学事业的国际化管理进程,同时能够明确政府的管理职能。基于此,文章结合国家自然科学基金绩效评估的目的、原则及方法,对国家自然科学基金绩效评估进行变量选取与实证分析,以期促进我国国家自然科学基金绩效评估获得更好的发展。
政务新媒体是互联网时代政府机构联系和服务社会大众的重要渠道。从政务新媒体的受众视角出发,对如何提升政务新媒体信息服务能力开展研究,对提升政务新媒体的运营管理水平、提供具有针对性的运营维护建议有一定的理论和实践价值。
<正>幼儿园教学通常以五大领域的内容为主,五大领域中就包含了美术这一学科。幼儿园的美术教育是幼儿成长过程中不可或缺的一部分。幼儿美术教育中包含着多种教育元素,艺术来源于生活,在美术教育中使用更多样的生活化材料能够为幼儿创造生活化的学习情境,让幼儿在熟悉的氛围中感受美术的魅力,获得来自生活的审美体验,使幼儿的美术素养得到提升。
期刊