基于神经网络的文本摘要及其评价方法的研究

来源 :桂林电子科技大学 | 被引量 : 1次 | 上传用户:szcarla
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
评价是自然语言处理领域中的热点研究方向,这些研究的共性是模型对原文语义的理解。随着科技的快速发展,特别是机器学习和深度学习的发展,这些研究可以很好的应用到机械产品设计的用户需求分析中。客户的产品需求中存在大量的信息,应用这些技术可以准确概括产品设计要求并且通过评价方法判断自动文本摘要模型对客户需求的解析是否准确。摘要研究主要包括摘要的生成和摘要评价,其中抽取式和抽象式摘要是自动文本摘要生成的两种主流的方式。抽取式摘要直接提取原文中的重要语句拼接形成摘要,但随着神经网络的发展,抽象式摘要成为了摘要生成的主流方法。该方法使用深度学习理论训练模型理解原文,进而生成摘要。模型生成摘要后需要对摘要的质量进行评价,摘要评价主要包括外部评价和内部评价。内部评价方法利用参考摘要与系统摘要的信息重合度评价摘要的质量。而外部评价方法与内部评价方法恰恰相反,这种评价方法无需参考摘要,它利用系统摘要代替原文档执行某个文档应用。虽然文本摘要和摘要评价都取得了较好的发展,但摘要模型在准确定位原文关键语义信息和主流的内部摘要评价标准ROUGE在计算待评价语句之间的深层语义信息方面及该种方法的评价结果不受参考摘要主观性的影响仍然有进步的空间,由此可以进一步推动摘要及评价研究的发展。本文对基于神经网络的文本摘要及其评价方法进行了研究。首先,为解决摘要模型难以定位并获取关键语义信息而导致摘要生成不准确的问题,提出了一种基于定位注意力与竞争机制的摘要模型,该模型提高了摘要生成的准确率。其次,本文为解决摘要评价方法ROUGE仅计算系统摘要与参考摘要之间的共现信息未考虑待评价语句之间的深层语义信息和评价结果受参考摘要主观性的影响的问题,将摘要评价方法的研究分为两部分。第一,提出了一种使用选择门和类内度量的语义匹配模型,能够解决摘要和原文语义匹配中存在非相似冗余特征而导致匹配准确率低的问题。第二,提出了使用语义相似的摘要评价模型,将使用选择门和类内度量的语义匹配模型与特征融合算法结合去完善摘要评价标准。针对基于神经网络的文本摘要及其评价方法的研究,本文的主要贡献如下:首先,为解决摘要模型难以定位并获取关键语义信息而导致生成摘要不准确的问题,本文设计了一种基于定位注意力与竞争机制的摘要模型。该模型主要包括三个部分:基于定位注意力和倒叙结构的序列到序列网络、基于选择门编码器网络和竞争机制。首先,通过重要信息概率叠加的方式利用关键字辅助关键句,增加注意力机制分配关键信息的权重进而定位关键语义信息,将其输入解码器生成摘要。同时,将关键句输入基于选择门编码器网络中,通过计算词语在句子中的语义分配概率挑选关键信息,将信息输入解码器中生成摘要。进而设计一种计算摘要与关键句余弦值的竞争机制,对以上两个网络生成的摘要进行优选,作为最终结果。实验表明,该模型在LCSTS中文数据集上测试Rouge-1为38.17%、Rouge-2为22.24%、Rouge-L为34.97%,优于目前较好的RNN-distract和DRGD模型。其次,为解决摘要和原文匹配中存在非相似冗余特征而导致匹配准确率低的问题,本文设计一种使用选择门和类内度量的语义匹配模型。首先,将待比较的句子经过双向长短时记忆网络向量化后输入选择门,通过计算词语在句子中的语义分配概率挑选最接近原始语义的关键特征,减少冗余信息的干扰。其次,提出了一种学习细粒度相似特征的融合损失方法,计算聚合层和预测层语义向量之间的距离,将其与原损失函数共同反馈到选择门,进而迭代优化关键特征,使得特征类内间距更小,进而利于句子语义匹配。实验表明,该方法在中文自制数据集和Quora英文数据集上测试,准确率分别能够达到96.01%和88.67%,优于目前表现较好的双向多角度匹配模型。最后,为解决ROUGE摘要评价方法只计算系统摘要与参考摘要之间的重叠信息及评价结果受参考摘要主观性的影响而导致摘要评价不合理的问题,本文设计一种使用语义相似的摘要评价模型。首先,将摘要和原文输入上述使用选择门和类内度量的语义匹配模型中计算语义相似得分。其次,本文提出了一种得分特征融合算法,使用语义相似得分和ROUGE得分计算置信距离矩阵、关系矩阵,通过界限值计算最佳融合组,再使用极大似然法计算最佳融合组的最优融合评价分数。实验表明,该方法在中文数据集上测试,变异系数F-1-cv是55.593、58.488和71.462,变异系数F-L-cv是52.736、61.685和74.857。在英文数据集上测试,变异系数F-1-cv是105.621、42.626和43.124,变异系数F-L-cv是107.996、42.062和37.298,在扩展实验中也证明优于ROUGE评价方法。总体而言,本文分别从摘要模型准确定位原文关键语义信息和完善ROUGE摘要评价方法的合理性等几个方面解决摘要生成不准确和摘要评价不合理的问题,并取得了明显的成效,对未来文本摘要技术应用到机械产品设计的需求分析中概括设计要素提供了技术支持。
其他文献
本文研究了Kundu推广的非线性薛定谔方程方程(Kundu-NLS)首先,我们得到了Kundu-NLS方程的一次达布变换并进一步推广到n次达布变换,并给出行列式表示形式.由已知的解Q出发,根
氧化钼作为一种具有层状结构的n型半导体金属氧化物,近年来在气体传感领域备受关注。然而,工作温度高、检出限不理想、选择性和稳定性差等问题限制了氧化钼在气体传感器领域中的实际应用,在其制备方法和气敏机理等方面仍有大量的探索性工作要做。因此,本文设计合成出多级结构花状α-MoO_3、富缺陷多孔的α-MoO_3纳米片和Ag/α-MoO_3纳米带三种材料。将上述合成的氧化钼纳米材料应用于气体传感器研究,可用
随着遥感技术的发展,高光谱遥感图像的分辨率也变的越来越高,所包含的地物信息也更加丰富,高光谱遥感图像中所蕴含的丰富的光谱信息和空间信息为地物分类的精细化提供了新的契机。但同时也带来一些问题,超高分辨率导致数据量大、冗余度高、波段数多且相关性强等若干问题,若直接对高光谱图像进行分类,不但会消耗大量的时间还会使分类精度不高。因此,如果能首先对高光谱图像进行去噪处理,再融合高光谱图像所蕴含的丰富的光谱信
可积方程是非线性偏微分方程中很特殊的一大类方程,与一般非线性偏微分方程几乎没有解法的情况非常不同,其特点是对同一个方程一般有多种求解方法。国内外很多学者在这方面都做
对于广义Radon变换而言,其明确的反演方程对重建算法的改进和投影数据的解的局部依赖性的研究有着很重要的意义,反演的思想方法对其他图像处理问题的研究也有着不可估量的价
生成技术一直是自然语言处理中一个重要且富有挑战性的课题,而自动摘要生成模型主要分为抽取式自动摘要模型和生成式自动摘要模型两种。本文分别研究了目前主流的抽取式自动摘要和生成式自动摘要模型,并对比了各自的优缺点,同时创新地提出了一种结合了抽取式摘要模型和生成式摘要模型的自动摘要模型TMSA(Text Rank-MMR-Seq2Seq-Attention)。模型构建的主要思路是:首先分别用Word2Ve
《四庫全書》提要之價值歷來為人們重視。但實際上,《四庫》提要在書名、作者、版本及內容等方面存在諸多問題。論文選取《四庫全書》四書類提要為研究對象。第一章通過匯校
罕见灾难事件的发生概率极小但危害极大,其发生会对金融市场波动与社会经济平稳运行产生重大影响,如2020新冠肺炎疫情的爆发,全球范围内出现了严重的经济衰退。随着经济全球化进程的加快,灾难风险的影响范围愈来愈广,各市场之间联动性不断加深,灾难经济领域的研究逐渐成为近年来众多学者关注的焦点。本文基于国际危机行为数据库,选择六个代表性危机维度来测度危机的严重性,构建危机严重程度指数CSI,研究时变灾难风险
随着我国知识产权战略实施的不断深入和创业环境的改善,专利创业作为专利转化和应用的一种重要方式也越来越被重视。但实际上,在专利技术构成创业机会的直接来源时,专利新创
趋磁细菌代表一类能够沿着地磁场线作定向运动的原核生物的总称。它们都是革兰氏阴性菌,并且能够利用环境中的铁离子在体内合成有链状排列的纳米级磁性矿物晶体,称为磁小体。