基于深度学习的机器阅读理解研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:bsqtld0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解,是自然语言处理的一个子任务,旨在让机器阅读、理解人类语言文本并回答相应问题,是自然语言处理与人工智能领域内最具难度的挑战之一,有重大的研究价值。近年来,随着大规模阅读理解数据集的发布以及深度学习技术的快速发展,机器阅读理解相关研究取得了令人瞩目的进展,但仍然面临诸多挑战:1)现有模型结构存在注意力冗余和语义融合粒度粗糙的问题;2)现有序列模型缺少辅助验证和决策;3)现有方法未充分发挥预训练模型的作用;4)现有训练数据集的构造存在高成本的问题。本文聚焦基于深度学习的机器阅读理解的研究,从注意力机制、对抗生成网络、预训练、问题生成等方面进行了深入研究,主要工作如下:第一,针对当前模型结构存在注意力冗余和语义融合粒度粗糙的问题,提出了一种全关注双向注意力融合架构模型(DIM)。该模型采用了多阶段、层次化处理,同时融合问题理解和全关注注意力,充分融合各层语义信息,捕获不同粒度的特征。在三个公开的抽取式机器阅读理解数据集上分别进行了验证。实验结果充分表明,DIM可以显著提高准确性,验证了全关注双向注意力机制的有效性。第二,针对现有模型单一且缺少辅助验证的问题,提出了一种面向多选机器阅读理解的神经网络架构模型(McGAN)。该模型借鉴生成对抗网络(GANs)的思想,分别设计了生成式机器阅读理解模型和判别式机器阅读理解模型,采取对抗训练方式使模型之间进行相互竞争和平衡,充分利用两种模型的各自优势以取得最优解。在三个选择式阅读理解数据集上的实验显示,McGAN架构大幅度提高了多选类型答案的精度,进而提升总体性能。第三,利用预训练机制,提出了一个面向特定领域(金融领域)的预训练模型(FinBERT)。通过构建涵盖更多知识的六个预训练任务,同时在通用语料库和金融领域语料库进行了多任务学习,FinBERT模型能够有效地捕获语言知识和领域信息。此外,针对FinBERT使用混合精度训练方法在Horovod框架上进行分布式训练,既保证了稳定的加速比,同时也具备良好的扩展性。FinBERT模型在包括金融机器阅读理解任务在内的多个金融数据集上均取得了大幅度提升。第四,针对构建标注训练数据非常昂贵的问题,提出了一个基于神经网络的问题生成模型(SiriQG)。该模型基于强化学习的深度语义增强神经网络架构。通过提出的分层融合注意力机制和高性能的混合评估器,将句法约束集成到注意力机制中,更好地对答案信息和文章信息进行建模。在两个公开的问题生成数据集上进行了实验验证,实验结果表明SiriQG模型可以显著提高问题生成的流畅度和模型准确性,验证了基于语义增强的问题生成模型的有效性。
其他文献
混凝土早期开裂不仅影响结构外观,还会使环境中的腐蚀介质通过裂缝侵入混凝土,对混凝土结构耐久性和使用寿命造成不利影响。引起混凝土早期开裂的因素有多种,其中混凝土结构或结构构件受到约束是一个重要因素,目前国内外有关方面的研究还不是很完善,特别是对混凝土结构收缩开裂后的耐久性能研究不足,混凝土结构耐久性设计中不能考虑可能的约束条件的影响。鉴于此,本文对不同约束条件(无约束、两侧约束和四侧约束)、不同水胶
传统抗生素耐药问题日趋严峻,耐药菌引起的多种疾病,如肺炎、脑膜炎、烧烫伤感染、糖尿病足溃疡感染、败血症等严重威胁人类生命健康。目前耐万古霉素金黄色葡萄球菌(VRSA)、耐碳青霉烯大肠杆菌(CREC)、耐多药铜绿假单胞菌(MRPA)等耐药菌引起的感染,在临床中缺乏有效的抗生素药物,且耐药问题一旦发生,同类药物药效大幅度降低,新型抗耐药菌药物的开发迫在眉睫。Cathelicidin宿主防御肽是脊椎动物
粤府办[2021]30号各地级以上市人民政府,省政府各部门、各直属机构:《广东省市场监管现代化"十四五"规划》已经省人民政府同意,现印发给你们,请认真组织实施。实施过程中遇到问题,请径向省市场监管局反映。2021年9月24日(注:《广东省市场监管现代化"十四五"规划》此略,详情请登录广东省人民政府门户网站政府公报栏目查阅)
期刊
纤维增强型复合材料因其高强度、高模量、低密度和材料性能可设计等优点而被广泛应用于航空、航天、汽车以及新能源等领域中。然而,复杂的材料内部结构会导致其破坏时表现出多种破坏模式,比如纤维破坏、基体破坏以及界面脱粘等。因此,复合材料破坏的研究对于结构安全性和稳定性的评估都起着至关重要的作用。近十年来,相场模型以其优美的数学结构和在处理裂纹问题上的优越性而被广泛应用于各类破坏问题的分析当中。本文针对纤维增
全钒液流电池(VFB)功率和容量可独立设计,且其正/负极采用同种金属的不同价态离子作为活性物质,使得容量易修复,因而在电化学储能领域具有良好的应用前景。离子传导膜是VFB的关键组件之一,主要作用为传导载流子和截留正/负极活性物质。理想的离子传导膜应该同时具有高离子选择性和低面电阻,然而对于普遍使用的均相膜,二者难以同时兼备。本论文提出具有致密分离层和多孔支撑层非对称结构的全钒液流电池离子传导膜,与
目前嵌入式软件应用日益广泛,软件规模越来越大,动辄上千万行C代码;大量采用定时器,逻辑结构复杂;存在中断多级嵌套以及CPU+GPU+FPGA异构的特点,导致软件开发和测试极为困难,这类软件的可信问题是安全关键行业面临的主要问题。从可信软件的角度来看,嵌入式软件可信至少应该包括功能可信和性能可信。所谓功能可信是指软件完成预期的功能,即软件执行的正确性;性能可信是指软件在规定的时限之内完成预期的任务,
卧式壳管式冷凝器被广泛地应用在空调制冷和石油化工等领域。对于空调制冷领域,卧式壳管式冷凝器是冷水机组、热泵机组和中央空调的重要组成部分,其换热效率直接影响着整套机组制冷和制热性能。在卧式壳管式冷凝器的设计中,换热管作为其核心部件,已由光管逐渐发展为换热性能更强的二维和三维肋管。针对由换热管组成的管束外膜状凝结换热计算,是该类冷凝器设计中的关键环节,其中管束效应系数是管束膜状凝结换热特性的重要参数,
长期以来,我国北方农村住宅冬季供暖一直是社会关注的热点问题;以燃煤和秸秆等为主要燃料的传统供暖方式,不仅燃烧效率低,而且也是冬季雾霾和环境污染的主要原因。因此,迫切需要在我国北方农村发展太阳能清洁供暖方式,发展太阳能建筑一体化技术。近几年出现的太阳能PVT热泵技术集发电、制热、制冷于一体,具有较高的太阳能综合利用效率,为我国北方农村住宅实现新型的太阳能建筑一体化提供了新的技术途径。为此,本文面向P
随着轻量化和低成本的需求,连续纤维增强复合材料由于具有高比模量、高比强度、耐疲劳和可设计性强等优势,在航天运载器中的应用比例逐步提升。由于低温推进剂贮箱在航天运载器推进系统中所占重量和体积的比例最大,发展无内衬复合材料贮箱结构)成为箭体结构轻量化的重要方向。由于贮箱结构服役时处于低温工作环境,复合材料组分相在热载荷作用下会因为热不匹配性而产生微观应力,引发基体开裂和纤维/基体界面脱粘等失效模式,共
工业生产能耗高、污染严重,有效提高工业能源的利用效率,实现节能减排已经成为国家重大需求。工业生产过程中伴随着大量的能源发生和消耗,对于能源介质的有效预测和优化调度是实现节能减排、保障安全生产的关键。考虑到以数据点为基本单位的建模方法无法有效描述生产语义或设备运行特征,且分析尺度受限,本文研究了多种基于数据粒度的多尺度预测与平衡调度方法,具体内容如下:针对工业能源介质的多时间尺度预测问题,分别提出基