基于XLNET语言模型的机器阅读理解模型研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:zxjxz33371
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究机器阅读理解任务是为了让机器能阅读并且正确理解自然语言文本,并能够回答给定的问题,由此衍生出大量的应用场景,对自然语言处理的其他领域也具有重大意义和价值。现有的机器阅读理解主流模型主要分为四个主体部分:表示层、编码层、交互层以及输出层,表示层采用的词嵌入技术具有单向性并且无法解决一词多义问题,输出层采用的答案预测模块无法输出既通顺又包含多数关键命名实体的句子。针对以上问题,本文研究了主流的机器阅读理解模型,构建了一个基于XLNET语言模型的机器阅读理解模型,以提升回答问题的准确率。主要研究内容如下:(1)针对早期词嵌入技术的局限性,引入XLNET语言模型精调预训练的词向量。XLNET语言模型在自回归语言模型的基础上引入排列机制,通过排列输入语句中各个单词顺序学习不同排列的上下文信息,增加了模型可利用的文本特征。(2)提出了多级语义融合模型,模型编码层采用多级双向LSTM网络提取文本语义特征,模型交互层利用多级注意力机制让各个网络节点学习其余节点的信息,使得模型预测答案时能够输出更准确的答案。(3)针对答案预测模块的缺陷,提出改进端到端的答案预测模块。通过融合Seq2Seq网络与指针网络,在生成句子的单词时能够同时拥有两个网络的优点,使句子通顺的同时包含多数命名实体。上述模型在SQuAD 2.0中获得了78.32%的EM与81.75%的F1分数,在MS\MARCO中获得了32.75%的ROUGE-L与34.12%的BLEU-4分数,对比于主流模型有了较大的提升。实验结果表明,本文的研究成果能较为有效地提升回答问题的准确率。
其他文献
随着互联网技术的日益发展,各类提供着丰富功能的应用平台迅速普及。人们在享受到便捷服务的同时,可以通过网络表达自己对各类事物的意见和看法。并且伴随网民数量的迅速增加,网络中带有用户主观信息的数据规模也呈爆炸式增长。这些主观信息对于个人的消费决策和商家的营销策略具有重大的参考价值。因此,使用文本的情感分析技术分析这些海量的数据,并从中挖掘用户的意见和价值趋向具有深远的意义和重大的研究价值。据此,本文对
有机无机杂化钙钛矿是由有机和无机组元在分子尺度上自组装而成的一类新的材料。在这种材料的分子结构中,无机组元通过共价键或离子键形成八面体框架,它为体系提供了良好的电学特性,例如导电性、电致发光和介电性转变等;有机组元占据着八面体框架的空腔位置,它为体系实现了自组装性和较高的荧光量子效率等。有机无机杂化钙钛矿的光电特性可以简单的通过改变有机胺、无机金属或卤素来进行调控,这些优势使它在太阳能光伏电池、电
基于光子学技术和微波毫米波技术相结合的微波光子学技术有望应用于卫星通信、相控阵天线、信号处理和相位编码技术等领域。相移器在相控阵雷达和信号处理领域扮演着重要的角色。基于微波光子学技术,本文提出了基于马赫曾德尔调制器(MZM)的微波光子相移器和基于双偏振双平行马赫曾德尔调制器(DP-DPMZM)的微波光子变频相移器,具体的研究工作和创新点如下:1.提出了基于马赫曾德尔调制器(MZM)和法拉第旋转镜(
近年来,随着社会经济与科学技术的发展,为了更高效、更广覆盖的通信效果,卫星通信发展迅速。路由是实现通信网络有效通信首要解决的核心问题,尽管地面网络路由研究已经十分成熟,但由于卫星网络结构复杂,规模庞大且动态变化,其性能、功能、结构和要求与地面通信大不相同,无法沿用地面无线通信网络机制。因此卫星网络路由协议的研究,包括路由协议的设计、验证和实现已经成为一项重要课题。目前大量卫星网络路由技术的研究基于
饲料行业是畜牧业甚至是农业经济的重要组成部分,但现阶段整个饲料行业有着较低的进入壁垒,其结果是饲料企业的实力、规模良莠不齐,使得饲料企业存在质量安全隐患,进而影响其下游市场,即畜禽产品的安全状况。尽管饲料产业相关法律法规不断出台、相关的行业标准不断完善以及相关从业人员认知水平不断提高,但是饲料质量安全问题仍然存在。因而,本研究将以饲料企业为研究对象,在控制了相关变量的情况下,研究制度压力对饲料企业
随着市场经济的飞速发展,小型企业已经成为国内经济较快增长的重要支撑。虽然多数小企业已认识到有效的内控是业务拓展和风险防范的重要保障,但因具有规模小、起点低、财务弱等特点,加上人力物力财力有限,不可能在短期内建立起一套完善的内部控制体系并有效、持续的运行。所以,基于企业经营效率和成本角度考虑,建立一套简单、实用的内部控制体系,采用合理、有效的管理方法付诸实施并持续提升内部控制效果,已成为小企业在内部
数字式仪表在日常生活和工农业生产中被频繁使用,因此提高对其读数效率和精度的研究势在必行。本文提出了基于机器视觉的数字式仪表读数识别系统,对于该系统的研究,主要进行了如下几项工作:首先,在对图像采集方案进行设计时,针对硬件设备必然会导致的标量图畸变问题,采用适当的设备校准、目标图像纠正技术进行设计优化;为获取尽可能优质的原图像,选用合适的矩形面光以及打光方案,并采购与项目要求相符合的图像采集设备。然
在我国经济体制的发展过程中,实体企业的发展越来越离不开金融的支持,随着我国金融体制的不断改革,以金融服务实体经济已是一大趋势。根据相关理论和实证分析可知,产融结合有利于减少实体企业与金融机构之间的交易费用、消除信息不对称、实现企业的内源融资及多元化发展。但是,产融结合在我国还处于初级阶段,其发展还有待提高。加之我国“三农”问题一直亟需解决,农业产业链条的优化和现代化发展需要有大量的金融资本来支持,
钛合金具有密度低、比强度高、生物相容性好等优点,已被广泛应用于航空航天、石油化工、汽车工业以及制造等领域,但由于其摩擦系数大、耐磨性差以及严苛条件(强腐蚀性离子Cl-
多传感器时间配准技术是信息融合系统前端数据处理的一项关键技术,时间配准效果的好坏是影响信息融性能的重要因素之一。随着信息领域科学技术的飞速发展,信息融合系统在民用领域和军事领域的应用越来越广泛,时间配准技术作为数据融合的前提,在异步信息融合系统中不可获缺。内插外推、最小二乘等方法是时间配准的常用方法,但是这些传统方法存在如配准时刻不灵活等使用条件限制,而且在较为复杂的运动模型下配准的误差较大,针对