【摘 要】
:
在当今世界,每时每刻都有大量的信息从各种渠道推送给人们,如何从这些信息中筛选出重要信息显得尤为关键,文本摘要就可以帮助做到这一点。本文主要针对句子级概括式文本摘要
论文部分内容阅读
在当今世界,每时每刻都有大量的信息从各种渠道推送给人们,如何从这些信息中筛选出重要信息显得尤为关键,文本摘要就可以帮助做到这一点。本文主要针对句子级概括式文本摘要任务和文档级摘取式文本摘要任务展开研究。对于句子级概括式文本摘要任务,提出了基于循环神经网络和基于卷积网神经网络的Sequence-to-sequence(Seq2Seq)模型:基于循环神经网络的模型结合了联合式选择机制,将输入输出结合起来进行关键信息的选择;基于卷积神经网络的模型引入了全局选择机制,使得原句每个单词的表示结合了全局上下文向量的信息。对于文档级摘取式文本摘要任务,提出了无监督式模型和有监督式模型:无监督式模型基于TextRank模型,并依赖句子语义相似度进行计算;有监督式模型基于Seq2Seq模型,采用类似Pointer Network的处理模式,并使用了选择性编码以更准确地选择出更关键的句子。在实验部分,对于句子级概括式文本摘要任务,所提出的模型在English Gigaword数据集上相对于基本的Seq2Seq模型在ROUGE-2上提升了1.92。文档级摘取式文本摘要任务以CNN/Daily Mail数据集作为测试集,无监督式模型相对于基本的TextRank模型在ROUGE-2上提升了0.94,有监督式模型相对于基线模型在ROUGE-2上提升了0.85。最后,根据所提出的文本摘要模型实现了一个文本摘要系统。
其他文献
在宽带和超宽带雷达中,受制于当前模数转换技术水平,基于奈奎斯特采样定理的雷达信号采集难以满足实际需要。压缩感知理论将高维稀疏信号随机投影到低维空间以实现压缩测量,
国内许多传统制造型企业已经逐渐感受到了同质化竞争的激烈性,单纯的产品的优势往往是短暂不可持续的。中国作为世界加工工厂,绝大多数传统制造行业的产品都会有大量同质化的
目的:通过免疫组化法检测舌鳞状细胞癌患者癌组织及癌旁组织中的FIP200、ATG7的表达差异,分析FIP200、ATG7与舌鳞状细胞癌的相关性及临床意义,为舌鳞状细胞癌的靶向治疗提供前期实验依据。方法:选取2012年-2019年于右江民族医学院附属医院就诊的36例舌鳞状细胞癌手术患者的石蜡标本用于FIP200免疫组化染色;34例舌鳞状细胞癌手术患者的石蜡标本用于ATG7免疫组化染色。经HE染色,镜
随着我国日化市场不断加大对外的开放力度,日化行业得到迅猛发展,已经成为世界上最具发展潜力的日化消费市场。在激烈的日化市场竞争中,JEUNESSE公司以其独特的创新市场营销战略突出重围,在欧美市场稳步增长的同时赢得了在华日化产品市场快速发展。JEUNESSE公司在中国市场如何通过符合中国市场环境的营销策略,实现复合增长率五年两位数的持续增长,为中国日化企业带来了深刻的借鉴意义。与此同时,JEUNES
目的:机械通气患者很容易发生呼吸机相关性肺炎,影响患者的总体预后,本研究将胸肺物理治疗应用于呼吸机相关性肺炎患者,与进行药物等常规治疗和常规护理的患者进行比较,探讨
近年来,中值滤波操作作为一种常用的图像后处理手段,越来越多地被用来掩盖其他图像篡改操作遗留下来的痕迹,图像中值滤波篡改操作的检测已经成为数字图像篡改取证领域的一个
随着协同制造模式的飞速发展和广泛应用,协同制造服务吸引了越来越多的用户,协同制造环境下的服务呈现海量增长的趋势,用户如何从大量的服务中准确选择满足其需求的服务,是当
同步辐射光是一种用途非常广泛的光源,可用于多种基础前沿学科的研究,同步辐射装置对于推动各学科发展发挥了重大作用。上海同步辐射装置总体性能位居国际前列水平,已在生命科学、凝聚态物理、材料科学、化学、能源与环境科学等学科的前沿基础研究和高新技术的研发领域取得了一些重要成果。在上海光源光束线站的各系统设备中,光束位置测量装置是其中非常重要的设备之一,它用于测量X射线的具体位置及其光斑大小。X射线的位置参
在生物学上,突触之间信息的传递是经过各种神经递质直接或间接地将刺激信号从一个细胞输送到另一个细胞,从而导致受体接收到的信息会发生一定的变化,最终各个信号的输入在突
呼叫中心(Call center)自上世纪九十年代进入中国,并一直呈现发展迅速的趋势,截至2013年末,中国呼叫中心市场投资达到900多亿美元,然而呼叫中心的发展仍旧存在很多问题,诸如