基于深度学习的文本自动摘要研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:iversonKKE3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络文化的快餐时代,数据资源呈现爆炸式增长,给人们带来信息过载的困扰,且随着社会节奏加快,生活压力变大,人们没有足够多的时间精力浏览所有文本信息,往往希望利用碎片化的时间去获取更多的有用信息。通过阅读文本,人们可以快速掌握文章主旨,判定文章的需要性,且不会被文章标题党所蒙骗,有效缓解信息过载引发的时间精力问题。文本自动摘要的主旨是将文本或文本集合转化为包含关键信息的简短摘要,按摘要的类别进行划分,可以分为指示性摘要,信息摘要,关键词摘要以及标题。随着近些年深度学习在自然语言处理领域的发展,基于Seq2Seq框架的自动摘要研究已成为主流。因此,本文在Seq2Seq框架的基础上,引入注意力机制,构建关键词摘要模型和信息摘要模型。主要研究内容如下:(1)基于深度学习的关键词摘要研究。研究使用基于word2vec词向量的文本语义表示以及基于Seq2Seq框架的关键词摘要方法,并引入注意力机制作为基线模型进行试验,与传统的机器学习方法进行比较,在此基础上引入了拷贝机制(Copying Mechanism),从输入序列中拷贝合适的片段到输出序列中。实验结果表明,在基线模型的基础上引入拷贝机制,能够提高关键词摘要生成的效果。(2)基于深度学习的信息摘要研究。提出基于语义相似度计算的信息摘要模型DVSNET,主要针对基线模型的无法正常解码未登录词问题以及生成式任务常见的重复问题,引入了指针网络模型和覆盖机制,并为进一步提升自动摘要质量,加入了文档相似度计算,最大化目标摘要与源文本的语义相似度。实验结果表明,该模型能够解决信息摘要中的未登录问题,缓解生成式摘要任务中的重复问题和通顺度问题。(3)自动摘要系统的设计及实现。介绍司法案例智能检索系统的总体设计思路和处理流程,并将生成的关键词摘要应用到该系统中;搭建自然语言处理平台,实现信息摘要的前端页面系统展示,证明自动摘要的实用性和有效性。
其他文献
能源危机和环境恶化是目前人类面临的非常严重的问题,光催化产氢技术的日益发展为能源和环境问题的解决提供了一种新的途径。传统意义上的光催化剂为半导体催化剂,但最新研究发现,金属纳米粒子(NPs)如Au、Ag、Cu等通过其表面等离子共振效应(SPR)在无半导体催化剂的存在下也可以用于光催化产氢。Cu因其在地球上储量丰富且是廉价金属,因此在光催化制氢领域受到人们的青睐。然而,纯Cu NPs化学稳定性较差,
LNG槽车中掺入液氮不但会降低LNG的品质,而且会使储罐的温度和压力发生变化,带来安全隐患。本文研究了LNG槽车中掺液氮后温度和压力的变化规律,提出一种判断LNG槽车中掺液氮情况的方法。建立掺液氮LNG槽车内温度和压力计算模型,计算结果表明掺入液氮后槽车储罐中的LNG温度会迅速降低,运输过程中温度上升速率较慢。建立计算LNG槽车掺液氮量模型,在已知原料LNG组分、初始温度和压力、槽车储罐的参数、运
森林土壤养分是指森林生态系统中能够直接或经转化后被植物根系吸收的矿质营养成分,是森林土壤肥力的重要组成部分,也是衡量森林土壤质量的重要指标,主要包括有机质(Soil org
随着信息技术的发展,互联网络的重要性日益凸显.然而,互联网络的处理器以及某些处理器之间的连线发生故障是不可避免的.因此,关于互联网络的稳定性成为目前研究关注的热点.因
东北黑土区农田春季土壤昼融夜冻与大风天气重合,从而导致土壤冻融作用对农田风蚀有重要影响,而当前土壤冻融作用对黑土区农田土壤风蚀的影响鲜有报道。为此,本研究基于室内
含蜡原油在其凝点温度附近及以下流动性较差,且具有复杂的流变特性。已有研究表明,对液态原油加载高压电场可显著降低含蜡原油在低于析蜡点温度、高于凝点温度时的黏度,但电场作用对含蜡原油结构特性(黏弹行为、屈服行为和触变行为)的影响尚不明确。本研究基于电流变原理,借助自行设计搭建的直流高压电场动态处理装置,研究了电场处理温度(介于油样的凝点和析蜡点之间)和电场处理场强(0-0.8 kV/mm)对含蜡原油结
新蚜虫疠霉(Pandora neoaphidis,Entomophthorales)是虫霉目真菌中最具代表性的蚜科专化性病原真菌,通过主动弹射孢子来侵染蚜虫,从而控制蚜害发生。有研究发现蓝光能显著提
目的:本研究旨在观察健脾除胀汤治疗功能性消化不良餐后不适综合征(脾虚气滞证)的有效性和安全性,为临床中医治疗脾虚气滞证功能性消化不良餐后不适综合征提供依据。研究方法
与国外大型储罐防火间距与消防配备标准相比,我国大型储罐的防火间距设定标准抵抗罐区火灾的风险较小。大型储罐一旦发生全表面火灾事故,极有可能引发沸溢事故,从而造成群罐火灾甚至整个油库的毁灭。为了控制油罐火灾对相邻储罐的热辐射损伤,防止灾害的进一步蔓延,制定合理有效的防火间距是很有必要的。借鉴世界各国对大型储罐防火间距的设定标准,采用火灾热辐射Mudan模型与火灾动力学软件FDS相结合,对储罐间距为0.
在快速城市化和城市热环境恶化的背景下,如何改善城市热环境已经成为亟待解决的课题。居住区绿地是城市绿地系统中使用最多的类型,其绿化质量的高低直接影响居住的环境质量,