基于TextRank算法的自动文摘系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jieean
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,互联网的发展日新月异,人们在日常生活中越来越离不开网络,互联网正逐渐变为人们接收和传播信息资源的主要媒介。然而,丰富的互联网资源给人们生活提供方便的同时,也要求人们耗费极大的时间成本去分辨出自己所需要的内容,过量的信息给人们带来的问题日益严重。而自动文摘技术通过计算机来对文本信息进行自动提炼和压缩,大大的降低了阅读成本,逐渐成为了应对海量网络信息所带来的困扰的最为行之有效的方法。自动文摘技术一经提出便吸引了世界上源源不绝的学者来进行研究,其实现方法也随着历史的进程逐渐进步、成熟,具有着不可估量的应用前景。本文主要通过对自动文摘技术发展历程中的各种实现方法的调研与分析,尤其是对基于TextRank算法的自动文摘方法的深入研究,发现TextRank算法在进行图模型构建和句子相似度计算时未能充分的利用句子中的文本特征,存在很大的改进空间。进而提出改进的基于TextRank算法的自动文摘算法,主要在进行图模型构建和句子相似度计算时综合考虑更多的文本特征,例如线索词,句子的位置信息,文本主题等,而不是简单的基于统计学方法。然后在NLPCC 2017中文摘要数据集上结合ROUGE评价指标设计相关实验,验证了本文提出的自动文摘算法的有效性。最后,基于本文提出的自动文摘算法,设计并实现了自动文摘Web系统,主要包括自动文摘算法实现过程及结果的展示,同时基于由互联网爬虫爬取的百万级文本数据实现了文本检索功能,搜索结果以文本标题加自动摘要的形式展现,降低用户的阅读成本。本系统旨在让用户能够在网页端体验自动文摘技术的实现过程以及基本应用。
其他文献
“农学专业技能训练”课程是实践性非常强的技能训练项目,主要为诸如制茶、茶艺类涉农专业展开课堂技能实训,或是走出学校到企业中参与社会实训.通过技能实训,大大提升学生的农事操作实践能力,将学到的理论知识融会贯通,提升农业专业知识综合素养,夯实基础,以后从业能快速适应,避免养成只懂理论不懂实践的书呆子.中职院校秉承着理论与实践齐步前行的宗旨,“农学专业技能训练”整体开展顺利,不过也存在一定问题,还有可优化空间,需要重视优化才行.本文首先对“农学专业技能训练”的课程设置进行概要性说明,其次阐述“农学专业技能训练”
林业的健康发展对国民经济与生态环境的可持续发展均有着非常重要的作用.但是,森林病虫害问题作为林业建设中的一大阻碍,如果不能有效对此予以防治,不仅会使整个林业的发展受到严重影响,还会对国民经济与生态环境的可持续发展造成较大的负面影响.因此,相关部门必须加大对森林病虫害防治的重视程度,通过深入分析引发森林病虫害的原因及目前森林病虫害的防治现状,提出有效的防治措施,以确保整个林业的发展水平得到大幅提升.
水利工程直接影响着人们的正常生产生活,是我国重要的基础设施,在国家经济建设和生态环境改善方面发挥着重要的作用.利用水利工程能够实现资源的有效利用,提高农业中的抗灾减灾能力,更好地为广大人民群众服务.随着国家加大对基础设施的投入力度,我国一些地区相继出现了水利工程建设,然而在水利工程建设的过程中还会存在一些质量问题.这是由多种原因引起的,为此,应该分析水利工程施工质量的影响因素,并且提出科学的解决方式,真正发挥水利工程的价值.
在造林绿化后需要继续进行的林业技术工作还有很多,其旨在保障苗木造林成活率与造林质量有效提升,对林木实施科学化管理,这其中就包括了对林木砍伐时间的科学选择等等.本文针对造林绿化后的林业技术工作,主要围绕造林成活率提升这一林后技术工作来讨论.
农村体育产业以及农村休闲旅游产业的不断发展,为我国新时期休闲农业与民族体育运动的融合奠定了坚实的基础.本文从当前我国新时期休闲农业与民族体育运动融合发展的现状入手,对休闲农业与民族体育之间的关联进行分析.针对二者融合发展过程中暴露出的部分问题提出了在今后融合发展的思路,笔者认为,我国休闲农业与民族体育运动融合发展的关键在于明确相关项目的制定原则、建立并完善文化传承机制、拓宽相关产品等.
农业强国梦是中国梦的强大后盾,而农业高等院校在实现农业强国梦方面发挥着重要作用,不仅可以为农业强国梦的实现输送源源不断的优秀人才,还可以提供更为先进的技术保障.在全面建设社会主义时代背景下,农业院校作为高等教育的重要组成部分,不仅迎来了新的发展机遇,更面临着前所未有的挑战.本文立足于新农科背景,针对我国农业院校体育教学改革的发展路径简要分析.
植物保护技术是与农业发展密切相关的技术,主要针对病虫害识别与防治、农药使用等开展研究.现代植物保护技术侧重于绿色管理手段应用,以促进生态文明建设.本文主要阐述了在生态农业中植物保护技术的应用方法,并探讨了该类技术深化推广的可行性策略.
在信息时代,人们的生活方式发生了较大变化,各行业的生产模式也在不断创新,信息技术的广泛应用,给予了各个领域强大的前进动力,信息化建设也成为当前许多行业的重要目标.在信息背景下,农业经济管理模式也必须要得到有效调整和优化,结合农业的具体发展需求,把信息技术与农业经济管理进行有效结合,利用信息技术的强大功能,拓展农业经济管理范畴,加速农业结构改革,这也是农业部门当前的重点任务.本文对此进行分析研究,并且提出了几点建议.
在21世纪,对个人信誉数据的需求渗透在各个方面,而传统的信誉数据获取方式费事费力,如何提高数据获取的效率、保障获取的数据的准确性与完整性至关重要。本文提出了基于属性分片的信誉区块链设计方案,主要工作为如下三个方面:首先,本文使用区块链和基于属性加密提出了一个信誉数据方案的框架。通过基于属性加密控制数据获取粒度保障数据的完整性,采用密文哈希上链的方式保障数据的准确性。本文设计了信誉数据获取各方实体与
伴随着装备设计方案选型需求任务的不断拓展,所需资源投入不断增加,针对装备方案优选的信息决策理论框架以及相关服务开发的研究开始大量涌现,决策方案的结果将对未来一段时间方案的发展产生影响,科学化决策方案的重要性日益突出。组合分析框架是在复杂条件下进行方案优选的基础理论支撑,对此框架的研究会直接影响决策方向,在当前瞬息万变的信息和多元复杂的环境条件下,对于实现方案的鲁棒性和自适应性意义深远。虽然目前已有