【摘 要】
:
随着互联网的日益壮大,信息大爆炸时代已然来临,现有的网络信息平台数据冗杂、充斥着各种广告或虚假信息,快速、精确地从海量数据中获取有效信息显得尤为重要。因此,如何利用自动文本摘要技术,帮助用户在最短的时间内获得最多、最有价值的可信信息成为自然语言处理领域的一个研究热点。目前应用较为广泛的自动文本摘要技术分为三类:抽取式摘要技术、生成式摘要技术和将两者相结合的抽取生成式摘要技术。基于统计或规则的抽取式
论文部分内容阅读
随着互联网的日益壮大,信息大爆炸时代已然来临,现有的网络信息平台数据冗杂、充斥着各种广告或虚假信息,快速、精确地从海量数据中获取有效信息显得尤为重要。因此,如何利用自动文本摘要技术,帮助用户在最短的时间内获得最多、最有价值的可信信息成为自然语言处理领域的一个研究热点。目前应用较为广泛的自动文本摘要技术分为三类:抽取式摘要技术、生成式摘要技术和将两者相结合的抽取生成式摘要技术。基于统计或规则的抽取式摘要实现简单、适应性广且贴合主题,但语义理解性差;基于深度学习的生成式文本摘要拥有更强理解和生成文本的能力,但存在可读性差、摘要偏离主题等问题。抽取生成式方法是将两者结合来完成文本摘要任务,本文的研究正是基于这种思想来实现的,主要研究工作如下:针对传统抽取式摘要方法与基于深度学习的生成式摘要方法各自的优势和弊端,提出了融合主题信息聚类编码的文本摘要生成模型TICTS。首先,文本生成主要基于Seq2Seq模型实现,模型编码端采用了Bi-GRU模型,其双向的神经网络可以较为完整的保留上下文信息,信息丢失的问题得到进一步改善;其次,为解决生成式摘要技术存在摘要生成过程缺乏关键信息控制和指导的问题,本文利用基于词向量的K-Means算法对文档进行聚类,筛选得到文本的主题信息,构建了主题注意力机制,并将其与Bahdanau注意力机制结合,用以捕获输入与输出词、输入与主题信息之间的关联强弱性;最后,解码端采用了LSTM模型,在充分利用文本上下文信息的基础上,提高了生成摘要的主题相关度。模型选用LCSTS数据集,采用ROUGE评价指标对模型进行评估,实验结果验证了模型的有效性。其次,设计并实现了新闻简报系统,将TICTS模型应用于新闻摘要的提取,为用户提供了一个简约、便利的新闻获取平台。系统根据用户需求进行了系统功能模块设计,包括新闻摘要浏览模块、新闻分类模块、新闻爬取模块、摘要生成模块以及文本转音频模块,实现了前端新闻界面与后台新闻发布系统的数据交互。其中,新闻摘要浏览模块和摘要生成模块是该系统的核心功能模块,通过应用自动文本摘要技术有效解决了新闻网站存在的冗余、片面、杂质信息等问题,提高了人们的阅读效率,避免了“标题党”新闻,满足了人们的碎片化阅读需求。该系统功能特色性强,具有较好的实际应用价值与应用前景。
其他文献
随着信息技术的加速发展,虚拟学习社区作为一个虚拟的学习空间,使学习者不断的进行交流、沟通、合作学习,充分展示自身智慧能力,为社区成员提供了知识共享、协作交互的学习环境,但在虚拟学习社区知识获取效率上存在着局限。而对于知识管理的研究则集中在企业来实现企业人员各能力的发展与企业创新能力,最终实现最大利益化,对于知识管理的研究较少的应用于教育方面的发展。因此,如何构建虚拟学习社区知识管理评价指标体系,提
随着资本主义社会发展,商品拜物教应运而生,人与社会之间的关系被颠倒,人被物所奴役。马克思认为,在其之后是具有比商品拜物教更明显的拜物教性质的货币拜物教;而资本拜物教是拜物教的最终完成形态,资本形式在在资本运作的过程中体现出来,资本内在的社会生产力夺取了本来属于劳动不变资本的创造能力,成为社会发展的推力。也是在此过程中,马克思分析了资本主义经济现象本质,批判了资本主义社会。同时,马克思拜物教批判理论
随着时代的发展和科技进步,现代篮球运动的发展趋势心中队伍之间技战术水平和身体素质的差距逐渐减小,心理素质逐渐成为影响技战术发挥的因素之一。在比赛过程中更需要良好的意志品质来保证运动员可以发挥出正常水平,从而取得良好的比赛成绩。大量研究表明,运动员的意志品质影响运动员比赛水平的发挥,也与竞赛成绩呈现一定的相关。本文采用文献资料法、问卷调查法、访谈法、数理统计法等研究方法,选用《优秀运动员意志品质评价
在微分方程理论研究中,有关定性性质研究是最重要的问题之一.振动性和渐近性作为定性研究的一部分一直备受关注.本文分别研究了正则条件下中立型的二阶、三阶以及偶高阶时滞微分方程的振动条件及渐近条件,利用已有的研究方法,如Riccati型函数,比较原理,积分中值定理,微分算子,链式法则等,建立了方程解振动的充分条件.并在此研究基础上,给出了更加有利于判别或计算的推论与估计.本文的研究内容安排如下:第一章,
王阳明作为中国哲学史上心学思想的集大成者,是我国著名的思想家、文学家、哲学家和军事家,其心学思想博大精深,是其理论思想的系统总结,也是其一生践履的有力体现。王阳明在道德意识与道德修养的不断阐发与相互涵养中,实现了对儒家内圣外王的理想追求,成为我国历史上少有的“立德、立功、立言”三不朽圣人,践履工夫作为阳明心学思想的精髓,是其实践道德的核心与灵魂。本文以践履工夫为切入点,分三章对践履工夫进行阐述。第
自进入21世纪以来,世界各国都积极谋求教育的新发展。我国新课改实施的目的是重塑当前的教育文化,以适应社会文化转型的需要,而教育文化重塑的关键是“人”的转型,要求教师从思想上达到一定的高度与认识,因此,转变教师的教学信念成了关键所在。随着HPM对我国数学教育影响的不断深入,HPM理念已经得到广大师范院校的重视,但在数学课堂教学中,数学史仍处于“高评价、低应用”的境地。导致这种现象出现的原因是多方面的
无论是在小学还是中学阶段,英语阅读都占有很大的比重。对于正在成长中的小学生来说,学会阅读不仅是语言学习不可缺少的一部分,也是影响其全面发展的重要因素。英语新课程改革以来,英语阅读教学逐渐从机械阅读训练转移到以提升学生的阅读素养为重点、全面激发学生的阅读兴趣、以学生为中心的教学上面来。然而,在很多小学的英语阅读教学中,都存在诸如阅读效率低下等一系列问题。如何丰富学生的语言知识,让学生掌握正确的学习方
听说读写是语言的四项基本技能。在实际教学活动中,相较于其他技能,口语表达所受重视程度相对较小,学生进行口语表达的机会较少并且口语练习的方式比较单一,一般通过跟读或模仿录音的方式进行。学生的口语水平不容乐观。为了提高学生的口语水平,潍坊市从2019年开始将英语口语水平测试纳入中考,采用人机对话的方式进行。随着现代电子信息技术的不断发展,手机等移动终端已成为人人唾手可得的工具,并且各种英语学习的软件层
由于半马尔可夫跳变神经网络能够更好地对物理系统进行建模和描述而备受关注,包括稳定性分析和控制,已被广泛用于垂直起降直升机,DNA分析和直流电动机控制.关于半马尔可夫跳变神经网络的许多重要研究已经有大量报道,例如稳定性分析,扩展的非脆弱耗散估计和控制设计.另一方面,与过去的点对点系统不同,当前的网络控制系统是通过网络连接的组件实现的.以周期性方式执行的时间触发控制会导致计算复杂度增加,通信资源浪费以
社区教育作为国民教育体系的重要组成部分,不仅肩负为社会培养所需人才的重任,还承担着完善终身教育体系,建设学习型社会的使命。面对人工智能时代下教育需求的升级、专业知识的革新以及智能工具对人力的替代等一系列新挑战,社区教育教师需要因时而动,把握教师专业发展的时代特质,重新审视自我,以更加契合智能时代的发展需求。本研究首先阐释社区教育教师专业发展的基本内容,然后结合他国对社区教育教师专业发展的基本要求以