论文部分内容阅读
评价是自然语言处理领域中的热点研究方向,这些研究的共性是模型对原文语义的理解。随着科技的快速发展,特别是机器学习和深度学习的发展,这些研究可以很好的应用到机械产品设计的用户需求分析中。客户的产品需求中存在大量的信息,应用这些技术可以准确概括产品设计要求并且通过评价方法判断自动文本摘要模型对客户需求的解析是否准确。摘要研究主要包括摘要的生成和摘要评价,其中抽取式和抽象式摘要是自动文本摘要生成的两种主流的方式。抽取式摘要直接提取原文中的重要语句拼接形成摘要,但随着神经网络的发展,抽象式摘要成为了摘要生成的主流方法。该方法使用深度学习理论训练模型理解原文,进而生成摘要。模型生成摘要后需要对摘要的质量进行评价,摘要评价主要包括外部评价和内部评价。内部评价方法利用参考摘要与系统摘要的信息重合度评价摘要的质量。而外部评价方法与内部评价方法恰恰相反,这种评价方法无需参考摘要,它利用系统摘要代替原文档执行某个文档应用。虽然文本摘要和摘要评价都取得了较好的发展,但摘要模型在准确定位原文关键语义信息和主流的内部摘要评价标准ROUGE在计算待评价语句之间的深层语义信息方面及该种方法的评价结果不受参考摘要主观性的影响仍然有进步的空间,由此可以进一步推动摘要及评价研究的发展。本文对基于神经网络的文本摘要及其评价方法进行了研究。首先,为解决摘要模型难以定位并获取关键语义信息而导致摘要生成不准确的问题,提出了一种基于定位注意力与竞争机制的摘要模型,该模型提高了摘要生成的准确率。其次,本文为解决摘要评价方法ROUGE仅计算系统摘要与参考摘要之间的共现信息未考虑待评价语句之间的深层语义信息和评价结果受参考摘要主观性的影响的问题,将摘要评价方法的研究分为两部分。第一,提出了一种使用选择门和类内度量的语义匹配模型,能够解决摘要和原文语义匹配中存在非相似冗余特征而导致匹配准确率低的问题。第二,提出了使用语义相似的摘要评价模型,将使用选择门和类内度量的语义匹配模型与特征融合算法结合去完善摘要评价标准。针对基于神经网络的文本摘要及其评价方法的研究,本文的主要贡献如下:首先,为解决摘要模型难以定位并获取关键语义信息而导致生成摘要不准确的问题,本文设计了一种基于定位注意力与竞争机制的摘要模型。该模型主要包括三个部分:基于定位注意力和倒叙结构的序列到序列网络、基于选择门编码器网络和竞争机制。首先,通过重要信息概率叠加的方式利用关键字辅助关键句,增加注意力机制分配关键信息的权重进而定位关键语义信息,将其输入解码器生成摘要。同时,将关键句输入基于选择门编码器网络中,通过计算词语在句子中的语义分配概率挑选关键信息,将信息输入解码器中生成摘要。进而设计一种计算摘要与关键句余弦值的竞争机制,对以上两个网络生成的摘要进行优选,作为最终结果。实验表明,该模型在LCSTS中文数据集上测试Rouge-1为38.17%、Rouge-2为22.24%、Rouge-L为34.97%,优于目前较好的RNN-distract和DRGD模型。其次,为解决摘要和原文匹配中存在非相似冗余特征而导致匹配准确率低的问题,本文设计一种使用选择门和类内度量的语义匹配模型。首先,将待比较的句子经过双向长短时记忆网络向量化后输入选择门,通过计算词语在句子中的语义分配概率挑选最接近原始语义的关键特征,减少冗余信息的干扰。其次,提出了一种学习细粒度相似特征的融合损失方法,计算聚合层和预测层语义向量之间的距离,将其与原损失函数共同反馈到选择门,进而迭代优化关键特征,使得特征类内间距更小,进而利于句子语义匹配。实验表明,该方法在中文自制数据集和Quora英文数据集上测试,准确率分别能够达到96.01%和88.67%,优于目前表现较好的双向多角度匹配模型。最后,为解决ROUGE摘要评价方法只计算系统摘要与参考摘要之间的重叠信息及评价结果受参考摘要主观性的影响而导致摘要评价不合理的问题,本文设计一种使用语义相似的摘要评价模型。首先,将摘要和原文输入上述使用选择门和类内度量的语义匹配模型中计算语义相似得分。其次,本文提出了一种得分特征融合算法,使用语义相似得分和ROUGE得分计算置信距离矩阵、关系矩阵,通过界限值计算最佳融合组,再使用极大似然法计算最佳融合组的最优融合评价分数。实验表明,该方法在中文数据集上测试,变异系数F-1-cv是55.593、58.488和71.462,变异系数F-L-cv是52.736、61.685和74.857。在英文数据集上测试,变异系数F-1-cv是105.621、42.626和43.124,变异系数F-L-cv是107.996、42.062和37.298,在扩展实验中也证明优于ROUGE评价方法。总体而言,本文分别从摘要模型准确定位原文关键语义信息和完善ROUGE摘要评价方法的合理性等几个方面解决摘要生成不准确和摘要评价不合理的问题,并取得了明显的成效,对未来文本摘要技术应用到机械产品设计的需求分析中概括设计要素提供了技术支持。