中文短语摘要的研究和系统开发

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:jianjian9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息检索过程中,在选择相关信息结果时,摘要常被用来支持用户快速、准确得进行判断。一种强调简洁(较短的长度)和简单(比较少的复合句)的指示性摘要被提出来,称之为“一瞥”摘要。基于这种“一瞥”摘要的思想,一种短语摘要的方法被设计开发出来,用来替代目前大多数摘要系统采用的重要句子选择的方法。基于这一想法,富士施乐公司对日文的短语摘要系统已经开发完毕,并投入应用。我们认为这种短语摘要方法同样也适用于中文信息检索系统。因此,本文针对中文短语自动摘要系统进行了研究和开发。由于日文短语摘要系统的设计是建立在日语语法结构上的,而中文和日文在语法结构上有很大的不同,所以中文短语摘要系统需要重新设计。语法结构的变化同样也要求在短语生成算法上的变化。在本文中,对日文短语摘要系统进行了简要的介绍之后,提出了针对中文的短语摘要系统的算法和设计方案。基于日文短语摘要系统的设计框架,我们开发了中文短语摘要系统的原型。日文短语摘要在生成短语时通过选择核心关系和添加必要的附加关系构成,而中文短语摘要系统通过分析原文,选择谓词参数(Pred-Arg)结构来生成摘要。LFG(Lexical-Functional Grammar)被用来进行原文基本解析。为了评价短语摘要系统的性能,我们改进了在给定信息检索的任务的情况下,基于任务的评价实验。该实验被设计类似在真实的万维网中检索资料,选择合适的规模的文件来判断文件的相关性,并引入新的评价方法来表示检索的准确性。实验的结果表明短语摘要在大多数情况下比目前其他的摘要方法在删选文件上有更高的准确性。
其他文献
近些年来,人们逐渐地认识到软件过程对于软件产品质量的决定作用。因此,软件生产开始进入以改善软件过程为中心的软件工程时代。人们提出了许多适合于指导现代软件开发项目的软
在基于对等网络的流媒体系统研究中,高效的媒体资源管理策略是一个重点研究内容。目前基于对等网络的直播系统技术日趋成熟,但由于点播系统固有的高度交互性特点使其设计和实
随着“服务”重要性的提升,网格正逐渐演化为“面向服务的计算基础设施”。作为网格服务的基础,网格容器提供了基本运行环境。网格技术的广泛推广使得网格程序的规模在不断变大
最近几年,互联网进入了飞速发展的时期,尤其是电子邮件的广泛使用极大的方便了人们的通讯交往,降低了人们的通讯成本,与此同时,也产生了新的问题——大量垃圾邮件的涌现,这也
摘要:早期诊断乳腺癌的最佳方法目前仍是钼靶X线摄影,特别是在乳腺良、恶性病变的鉴别诊断和乳腺癌早期诊断方面具有不可替代的作用。医生阅读大量的乳腺X线照片后的准确度会
随着中国电信“九大战略”的提出,信息化战略规划(ITSP)以及信息化建设开始在各省电信公司逐步实施。为了解决旧系统没有考虑全局的需求和管理所造成的信息孤岛的现象,提出了OS
嵌入式产品正以不可思议的速度闯入人们的日常生活。MP3、MP4、智能家电、智能手机等电子产品到处可见。这些现象表明,嵌入式时代已经在不知不觉中来临。随着硬件技术的飞速发
近年来,随着分布式计算技术的深入研究,网格计算和Web服务都得到了飞速发展。在网格计算方面,网格的概念已经从传统的利用分散的计算资源进行高性能计算,转变为整合资源共享
随着网格研究的不断深入以及网格基础设施的迅速发展,越来越多功能强大的网格应用不断出现。网格工作流系统是众多网格应用中非常具有发展前景的一个领域。网格工作流系统协调
对象存储是存储领域新兴的发展趋势,它综合了SAN和NAS的优点,同时具有SAN的高速直接访问和NAS的数据共享等优势。与传统存储系统比较,实验证明对象存储是一种具有高性能、高