基于实体注意力的生成式摘要算法

来源 :现代计算机 | 被引量 : 0次 | 上传用户:nilaomei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息过载问题日益严重,对新闻长文本进行自动摘要,不仅可以帮助读者实现快速精准地浏览,也能够减少撰写摘要所需要的人力物力.现有的自动文摘算法主要分为抽取式和生成式两大类,前者注重从原文抽取关键句子,后者倾向于模仿人类总结摘要的过程对原文进行理解和压缩.然而现有的算法中,面向中文长文本摘要的研究较少,并且大多数算法都聚焦于提升生成摘要的可读性而忽略了事实准确性.针对以上问题,本文提出了一种基于实体注意力的生成式摘要算法,将实体注意力与时序注意力相结合,并将实体信息引入了损失函数.经实验,所提出的模型在中文长文本数据集CLTS上取得了45.86的ROUGE-L得分,和其他模型相比能生成具有更高可读性的摘要.
其他文献
贵州某金矿石金品位为9.20 g/t,矿石中的金主要以单体金和连生金的形式存在,分布率为73.75%,硫化物中的金分布率为18.00%,其他为氧化物和硅酸盐包裹金;矿石中金属矿物主要为黄铁矿,脉石矿物主要为石英;金多以自然金的形式产于石英间隙及硫化物中,呈不规则粒状、圆粒状产出,主要载体矿物为黄铁矿;自然金的嵌布形式以裂隙金、晶隙金为主,包裹金少量.为了确定矿石的合理选矿工艺,进行了选矿试验.结果表明,矿石在磨矿细度为-0.074 mm70%的情况下,采用1次离心机重选,1粗3精3扫、中矿顺序返回浮选流程
通过对磷化底漆的原理和特点进行分析,在原有车辆识别码防腐工艺基础上开发了一种车辆识别码防腐工艺,该工艺通过刷涂磷化底漆有效地解决了因车辆识别码打刻而造成的锈蚀问题,同时不影响后期的多次拓印,为车辆识别码的防腐提供了一条新的解决路径.
2021年6月4日,1991年诺贝尔化学奖获得者、苏黎世联邦理工学院(ETH)名誉教授理查德·恩斯特(Richard R. Ernst)去世,享年87周岁.rn1993年8月,恩斯特教授来华访问,在此期间,接受了本刊主编胡柏顺研究员的采访,并欣然为本刊题词:rn恩斯特1933 年出生在瑞士温特图尔,童年时期对音乐兴趣浓厚,13岁时机缘巧合之下在阁楼里发现了一个装满化学品的箱子,恩斯特开始尝试用它们进行各种想像的实验.结果,有的发生了爆炸,有的则产生了令人难以忍受的毒气,充满了整个房间,他的父母心惊肉跳,但
期刊
针对传统分布式架构的不足,本文设计了引入微服务架构的系统.整个系统分为用户访问层、业务微服务层和数据访问层三层,在中间业务层将核心的用户模块、笔记模块、笔记本模块等功能抽取为微服务,列举出核心模块数据库表之间关系,以笔记查询业务为例,介绍了服务消费者调用生产者的过程.微服务架构的实现采用Dubbo框架,使系统具有良好的服务调用和负载均衡的能力.
中国汽车工业协会发布数据显示,2021年中国新能源汽车产销分别完成354.5万辆和352.1万辆,同比均增长1.6倍,市场占有率达到13.4%,高于2020年8%.尤其12月,新能源汽车产销分别完成51.8万辆和53.1万辆,再创历史新高,同比分别增长1.2倍和1.1倍.2021年竟然成为了我国新能源汽车爆发式增长的一年.
期刊
互联网在线应用的迅速发展,使网络中加密流量的数量激增,复杂性增大,这对加密流量的分类问题提出了严峻的挑战.为此,提出一种基于聚合残差网络的加密流量分类方法,该方法使用的模型结合了分组卷积、特征聚合的结构以及残差网络的跳接思想,并充分发挥了一维卷积神经网络在处理一维数据时的优势,实现对加密流量的准确分类.对公开数据集“ICSX VPN-nonVPN”中12种不同类型的流量进行分类的准确率达到了98.1%,在精确率、召回率和F1分数上的均值分别达到了98.2%、97.3%和0.977.
在无人机的应用当中,路径规划是其中一项核心技术,是确保无人机高效完成工作的重要保障.A*算法是常用的算法之一,它主导的是全局规划,在无人机航迹规划区域应用很普遍.动态窗口法在局部避障方面应用非常普遍,高度依赖于全局参数.为了给无人机在运行过程中规划一条好的路径,将A*与动态窗口算法融合在一起,建立无人机运动模型,确保全局最优路径的前提下,再进行局部环境的避障.
1975年后有限元数值极限方法的出现和计算机的应用和发展,使得工程材料的弹塑性解析计算进入到数值极限计算的新时代.文章所研究的岩质隧道就是采用了这一新方法,即强度折减法与荷载增量法,以及最近提出的极限应变法.为解决岩体隧道围岩力学参数的不确定性,提供较为科学合理的围岩力学参数,必须做好理论、勘察和经验相结合的围岩分级工作.以轨道交通隧道围岩分级为例提升分级的水准,包括强度指标的改进,以定量分级为主的分级方法,合理确定岩体基本质量指标BQ值,增加围岩分级数量,制定区间隧道与车站隧道的围岩分级表,定性与定量分
准确可靠的径流预报在水资源的优化管理中发挥着越来越重要的作用.为了提高预测精度,提出了一种神经网络模型,来进行日径流预报.此模型将经验模态分解(EMD)方法、注意力机制、BiLSTM神经网络相结合,并且对输入数据采用了插值方法来提升精确度.EMD方法能够将非稳态非线性的径流时间序列分解成多组本征模态分量和趋势项,实现输入时间序列的稳态化,再经过注意力机制赋予时间序列不同关注度,然后通过BiLSTM分别预测再重构.将该模型应用于四川省宣汉县的清溪河站点的每日径流数据上,与另外三种神经网络模型即LSTM、AT
针对传统支持向量机(support vector machine,SVM)处理非平衡的数据分类泛化性能差的问题,提出了一种基于主动学习的非平衡SVM分类方法(the imbalanced SVM classification method based on active learning,ISVM_AL).该方法先对多数的负类样本进行划分采样,再与少数的正类样本合并训练得到初始分类器,并根据负类剩余样本集中样本与分类器间的距离,选择主动学习中的关键信息样本逐次加入到负类训练样本集中,同时删除负类训练样本集