基于序列到序列模型的抽象式中文文本摘要研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jindere
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]为更好地处理文本摘要任务中的未登录词(outofvocabulary,OOV),同时避免摘要重复,提高文本摘要的质量,本文以解决OOV问题和摘要自我重复问题为研究任务,进行抽象式中文文本摘要研究。[方法 /过程]在序列到序列(sequencetosequence,seq2seq)模型的基础上增加指向生成机制和覆盖处理机制,通过指向生成将未登录词拷贝到摘要中以解决未登录词问题,通过覆盖处理避免注意力机制(attention mechanism)反复关注同一位置,以解决重复问题。将本文方法应用到LCSTS中文摘要数据集上进行实验,检验模型效果。[结果/结论]实验结果显示,该模型生成摘要的ROUGE(recall?orientedunderstudyforgistingevaluation)分数高于传统的seq2seq模型以及抽取式文本摘要模型,表明指向生成和覆盖机制能够有效解决未登录词问题和摘要重复问题,从而显著提升文本摘要质量。
其他文献
文中针对塑料模典型产品的结构特点,对各部分结构的设计要素进行了总结.为模仁、镶件、侧抽芯件、模架、标准件、浇注系统、冷却系统、顶出系统的快速设计提供了平台.此外,模
依据刺激-反应模式,本文将扶贫开发政策和社会保障政策的组合作为贫困户的行为刺激,重点研究如何有效组合这两类政策,形成有效刺激,以最大化贫困户的福利水平、以及由贫困户
惯性摩擦焊是一种过程中包含热力复杂变化的固态焊接方法,焊接过程中飞轮储存的能量转化为热能使得焊接面附近温度迅速升高达到热塑性状态,并在压力和摩擦热的作用下完成焊接
[目的]了解肿瘤化疗病人恶心、呕吐健康教育需求现状,并采取相应的护理对策,进而减轻肿瘤化疗病人恶心、呕吐症状。[方法]采用自行设计的问卷对188例肿瘤化疗病人进行调查,内
丹尼尔·笛福的《鲁滨逊漂流记》自18世纪初诞生以来,经过无数次的艺术和媒介转化,其中着墨最多的无疑是文本的“帝国主义”色彩。本文选取三部拍摄于不同时期的以《鲁滨
随着现代工业的不断发展,人们对产品的要求也越来越高,随之而来的就是产品在生产过程中所使用的刀具种类和数量也越来越多,而刀具的选择是否合理、配送是否及时将直接影响到
<正>黑色素瘤源于神经脊黑素细胞,多发生于皮肤,由细胞色素痣、发育不良痣演变或新发而成,与紫外线照射、创伤与刺激、免疫抑制、家族遗传等因素有关[1]。目前,黑色素瘤占皮
精神药物中毒在急诊中占有较高的比例,多为精神病人在消极情绪支配下用以自杀、或在幻觉、妄想的支配下吞服大量药物。少数为误服所引起,大量抗精神病药物、抗抑郁药、抗躁狂药
<正> 电子束是用一只装在真空室内的电子枪发射出来的高密度电子流,其最高的能量密度可达109W/cm2,是几种高能量密度的能源中能量密度最高的一种。与激光束作一简单的对比,可