文本自动摘要及其在航空安全报告中的应用研究

来源 :中国民航大学 | 被引量 : 1次 | 上传用户:lwh849453
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航空安全报告数据量大,篇幅较长,且涉及民航生产的方方面面,全部阅读并理解这些报告需要丰富的专业领域知识和较长的报告阅读时间,人力和时间上的投入较大。本文尝试研究基于深度学习方法的自动文本摘要技术,并将其应用于航空安全报告的自动摘要生成,可以节省大量人力去做读写工作,在一定程度上减少了工作时间,也解决了人工生成摘要成本高的问题。本文基于生成对抗网络和强化学习方法,对解决文本自动摘要生成问题进行了研究,系统总结了常用自动文本摘要模型,提出了两种生成方法。主要研究工作如下:1、针对有监督的深度神经网络方法,在航空安全报告生成中存在错误累积,生成摘要准确率低等问题,提出一种基于强化对抗思想训练的文本自动摘要生成模型。通过将生成对抗网络鉴别器作为强化学习的奖励函数及时指导生成模型优化,尽量避免错误累积;通过在航空安全报告生成过程中加入目标指导特征,帮助摘要生成模型获取更多文本结构知识,提升摘要生成模型真实性。在合成数据和航空安全报告数据集上的实验结果表明,该方法在航空安全报告自动摘要生成任务中,较之前的摘要生成模型在准确率和可读性上有了进一步的提高。2、针对基于强化对抗思想训练的模型,在面对航空安全报告这种长文本摘要生成任务中,存在信息丢失、摘要和原文关联性低的问题,提出一种基于循环生成对抗网络的文本摘要生成模型用于航空安全报告文本摘要生成任务中。该模型在加入目标指导保证文本结构严谨的基础上,使用循环生成对抗网络的方式通过循环一致性约束来保障生成的摘要保留报告原文信息,增强生成的摘要和报告原文的关联性,从而解决强化对抗思想训练的摘要生成模型的信息损失问题。最终生成的摘要既结合了原文的无损信息又保证了文本结构的严谨性。在长短文本摘要生成任务上的实验结果表明,该方法在航空安全报告的自动摘要生成任务中,较之前的文本摘要生成模型效果有了进一步的提高。
其他文献
船舶操纵与运动控制系统是一个伺服系统,受外界干扰影响显著,存在输入饱和、时滞、死区等特征。同时,船舶运动数学模型具有强不确定性、非线性等特征,设计具有良好控制性能的
由于良好的力学性能和机械性能,如断裂韧性和时效强度高、比强度高、冷成型好等,钛及钛合金材料在航空航天等诸多重要领域都有重要应用。但钛及钛合金材料的一些固有缺陷制约
复合材料相较于其它材料具有较的质量,良好的耐腐蚀性能,较高的强度和刚度,因其众多优点被广泛的应用到航空航天与军工领域。复合材料在制造中,可能受到工艺,生产环境因素的
自2006年Pfeiffer提出基于常规X射线源的光栅相衬成像方法以来,此相衬成像方法得到了广泛的研究,并最有可能应用于实际生活中。该成像方法的优点是在常规X射线源中就可获得相
功率放大器(Power Amplifier,PA)是无线通信系统中不可或缺的器件,其性能好坏直接影响着整个无线通信系统的工作质量。由于功放的核心器件是半导体晶体管,其本身呈现出固有的
随着高科技的不断发展,人们的生活越来越便利的同时,也给个人和社会带来信息安全的隐患,利用高科技手段伪造身份证、银行卡及知名品牌的商标等重要证件,给个人财产、商业以及
现实中的数据往往具有多标记性。例如,一张图片可能同时包含“沙漠”、“骆驼”和“蓝天”等语义标注;一篇新闻报道可能同时包含“经济”、“战争”和“政治”等主题;一段话
近年来,世界各国争相探索海洋新能源,海洋污染问题和大国海权之间的斗争,使得海上作业需求日益增加,进行海上任务的风险逐渐增加。为了确保海事人员的安全,同时增加海事任务
学校各项业务都引入了信息系统,目的在于实现各项工作的高效处理,目前在学校应用较多的包括学生信息管理系统以及资产管理系统等,但是学生成长记录业务依然没有实现信息化建
随着科学的发展和技术的进步,针对工业生产的过程监测成为目前相关领域的研究热点。间歇过程是一种比较重要的工业生产方式,其工艺机理复杂,常存在多个操作阶段,而且产品质量