【摘 要】
:
近年来,随着网络信息的不断增长,通过互联网获取信息已经成为人们获取信息最直接也是最必不可少的渠道,但是想要快速有效的从海量信息中获取人们最想要的信息却是难以实现。
论文部分内容阅读
近年来,随着网络信息的不断增长,通过互联网获取信息已经成为人们获取信息最直接也是最必不可少的渠道,但是想要快速有效的从海量信息中获取人们最想要的信息却是难以实现。多文档自动摘要是有效解决这一问题的方法之一,因此,多文档自动摘要的研究具有十分重要的理论意义和实践价值。主要的任务是挑选出文档中最能表达主旨的句子,因此其中最关键的问题是如何挑选出这些最具代表性的句子。当前的研究都是通过给各句子打分来进行挑选,而基于图模型的句子打分方法更是当前研究的一个热点。该方法通过构建一个以各句子为顶点、句子之间相似度为边权重的句子图,然后在通过多次迭代计算出各句子的最终得分,并以此得分为挑选文档摘要句子的依据,根据句子的重要性程度排序文档中有限长度的句子,排序较高的句子因其重要程度高而被作为最终的摘要句反馈给用户。然而,该方案只是针对句子层面的信息进行排序处理,而忽略了更多的语言信息。本文针对基于图模型的多文档摘要算法中存在的以上问题,研究融合文档中各句子所含的词项信息以及各句子所属的文档信息,构建一个包含词项、句子以及文档的三层图模型结构,通过该方法提高多文档自动摘要的质量。在DUC’2003和DUC’2004多文档自动摘要数据集上的实验结果表明本文所提出的三层图模型算法显著地优于传统多文档摘要算法。
其他文献
伴随着基因组和蛋白质组研究日新月异的快速发展,相关信息出现了爆炸性增长,迫切需要对海量生物信息进行处理。其中,大量的生物学数据是以结构化的形式存在于数据库中的,例如基因
伴随着油田开发程度不断深入,油井中各种物理、化学堵塞现象日渐增多,导致原油产量下降,开发成本上升。低频电脉冲解堵技术在油层造缝解堵方面虽具有自身优势,但实际采油生产
目前,在一个系统内,各个基层部门在Internet上已经建立了大量的数据库,但是这些数据库缺乏相互之间的信息共享,形成信息孤岛。同时,随着企业信息化的逐步深入,企业内部及企业之间也
在典型的分布式防火墙模型中,由策略控制中心统一管理安全策略的制定和分发工作。随着网络规模的不断扩大,策略控制中心的负载越来越重,同时分布式防火墙规则的制定也越来越复杂
本文通过对无锁的软件事务内存机制的研究,将OpenMP和事务内存的优点有机结合,对OpenMP模型进行了有益的扩展。该扩展工作在保障程序并行性的同时,又能有效确保程序执行的正确性
本课题提供了一种视频电话的设计方案,可满足企业用户和个人用户对视频通话的需求。通过方案制定,芯片选型,原理图设计,PCB设计,操作系统移植等环节,设计并实现视频通话的基
移动Ad Hoc网络(MANET)是由一组带有无线通信收发装置的节点组成的一个临时多跳的自治系统。作为一个无中心和基础设施的移动通信网络,它可以在任何时候、任何地点快速的构建
伴随不断进步的技术和不断深入的研究,无线传感器网络(WSN,Wireless sensor network)得到了更加广泛的应用,帮助人们更好的感知周围的物理环境。但是由于传感器节点部署环境
随着多种多样的蠕虫不断地涌入到网络中,Internet的安全问题日趋严重。近年来,蠕虫的传播方式也趋于多样,甚至出现了利用P2P系统作为载体进行的传播,对Inernet造成了更大的威
随着通信技术、计算机网络技术的不断进步以及人们对移动通信需求的不断增强,无线网络已经成为网络技术发展的最重要分支之一。移动自组网是一种新型的无线移动通信网络,它不