TMSA:一种两阶段的自动摘要生成模型

来源 :暨南大学 | 被引量 : 0次 | 上传用户:MyraChen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生成技术一直是自然语言处理中一个重要且富有挑战性的课题,而自动摘要生成模型主要分为抽取式自动摘要模型和生成式自动摘要模型两种。本文分别研究了目前主流的抽取式自动摘要和生成式自动摘要模型,并对比了各自的优缺点,同时创新地提出了一种结合了抽取式摘要模型和生成式摘要模型的自动摘要模型TMSA(Text Rank-MMR-Seq2Seq-Attention)。模型构建的主要思路是:首先分别用Word2Vec和BERT两种预处理模型得到句子的特征,再将句子的特征作为输入并通过Text Rank模型和MMR模型组成抽取器抽取文章中的重要句子,最后再利用Seq2Seq-Attention模型构建生成器并将抽取的重要句子进行压缩,从而使生成的摘要同时具备精炼性和概括性。同时,为了检验生成的摘要的效果,本文提出了一种新的摘要评分模型,即在目前广泛运用的ROUGE评分体系上,增加了冗余度、相关性和重要性三个指标,并且将其融合,构成一个综合摘要评分指标。本文的实验结果表明,在ROUGE评分上面,本文的模型效果在ROUGER-1、ROUGE-2和ROUGE-L上面都优于单一的Text Rank、MMR模型,并在ROUGE-L上优于Seq2Seq-Attention模型。而在冗余度、相关性和重要性方面,总体性能也优于单一的Text Rank、MMR、Seq2Seq-Attention模型。从实际生成的摘要效果来看,本文的摘要更加通顺简练,具有较高的实用性。
其他文献
随着科技的发展,气象观测领域也由传统人工监测逐渐走向全自动化处理。出于传统气象站体积较大且大多数采用短距离传输等原因,自动气象站的应用场景与功能的全面性受到了一定限制。并且随技术进步而积累的气象数据量也逐渐增长,若依然采用传统算法进行气象预报会造成严重的数据资源浪费。因此,气象领域迫切需要某种高效提升气象监测与预报效率的自动化设备。在分析系统需求后,本文设计并实现了一种便携的自动气象监测预报系统。
作为计算机视觉与图像理解领域的重要基础,目标检测在无人驾驶、军事目标识别和智慧医疗等领域起到了关键作用。从海量数据中提取出图像的高级语义特征及给出关注目标的类别与所处位置十分重要。然而,不同场景下的数据有不同的特点,比如通用目标检测中的图像涉及物体种类多、三维目标检测需要与点云数据结合。针对上述场景,本文先研究通用图像目标检测,从检测子网络着手优化二维图像的平行框检测效果;接着去除平行框约束,从抽
在当前全球化的大背景下,企业能够脱颖而出不单单凭借资源,更多的优势体现在技术层面,国家需要依赖高技术产业提升竞争实力,在国际间有立足之地。改革开放四十年以来,中国在高技术产业方面取得了迅猛的发展,但在国际间仍然不具备较强的竞争力,主要原因在于高技术产业的创新效率不高。因此,优化创新资源配置,寻找中国高技术产业创新低效的根本原因现在已经成为中国高技术产业发展的当务之急。本文通过理论基础的运用及实证分
近年来,国家经济迅猛成长,教育事业也得到了蓬勃发展,各大高校也在不断扩大办学规模,其经济活动和体制结构越来越复杂化,同时我国高校也在通过多种方式拓宽资金筹集的渠道,其资金不仅来自于政府拨款,还包含了社会的捐赠和科研项目的成果资金等,其资金来源越来越多元化。这给高校带来一定发展机遇的同时,也使其面临更大的挑战。因此,要想规避财务内部控制造成的风险隐患,就需要推动高校财务内部控制体系的不断改进和完善,
自改革开放以来,我国扶贫工作取得了举世瞩目的成就,为如期全面建成小康社会,国家大力推进精准扶贫、精准脱贫。经济帮扶有效缓解了贫困人口眼下的生活困境,而文化才是彻底脱贫的关键,才能根本改变贫困人口的生存困境,精准扶贫工作中文化帮扶绝不能缺位。图书馆作为传播文化、传承文明的重要载体,理应承担起文化扶贫的重任。贫困地区图书馆有针对性的建设能够发挥图书馆投入资源少、作用时效长的显著优势,有效助力精准扶贫。
本文研究了Kundu推广的非线性薛定谔方程方程(Kundu-NLS)首先,我们得到了Kundu-NLS方程的一次达布变换并进一步推广到n次达布变换,并给出行列式表示形式.由已知的解Q出发,根
氧化钼作为一种具有层状结构的n型半导体金属氧化物,近年来在气体传感领域备受关注。然而,工作温度高、检出限不理想、选择性和稳定性差等问题限制了氧化钼在气体传感器领域中的实际应用,在其制备方法和气敏机理等方面仍有大量的探索性工作要做。因此,本文设计合成出多级结构花状α-MoO_3、富缺陷多孔的α-MoO_3纳米片和Ag/α-MoO_3纳米带三种材料。将上述合成的氧化钼纳米材料应用于气体传感器研究,可用
随着遥感技术的发展,高光谱遥感图像的分辨率也变的越来越高,所包含的地物信息也更加丰富,高光谱遥感图像中所蕴含的丰富的光谱信息和空间信息为地物分类的精细化提供了新的契机。但同时也带来一些问题,超高分辨率导致数据量大、冗余度高、波段数多且相关性强等若干问题,若直接对高光谱图像进行分类,不但会消耗大量的时间还会使分类精度不高。因此,如果能首先对高光谱图像进行去噪处理,再融合高光谱图像所蕴含的丰富的光谱信
可积方程是非线性偏微分方程中很特殊的一大类方程,与一般非线性偏微分方程几乎没有解法的情况非常不同,其特点是对同一个方程一般有多种求解方法。国内外很多学者在这方面都做
对于广义Radon变换而言,其明确的反演方程对重建算法的改进和投影数据的解的局部依赖性的研究有着很重要的意义,反演的思想方法对其他图像处理问题的研究也有着不可估量的价