基于事件本体的自动文摘研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:op0034
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的到来不仅提供了海量的数据供我们研究和使用,同时也对我们快速、有效获取信息能力提出了一大挑战。文章摘要则在一定程度上缓解了人们的这一难题。文章摘要能以简洁准确全面的语言反映某一文档或多个文档的主要内容。因此,人们可以通过阅读文章摘要来了解文章的重要而全面的信息,然后根据用户的兴趣来决定是否阅读该文章。随着科学技术的发展,计算机技术应用到了文章摘要领域,使得生成文摘的效率大大的提高,也出现了许多自动文摘的技术和方法。   本文提出的基于事件本体的自动文摘是事件信息抽取技术、本体技术与自动摘要技术相结合的一种语言处理方法,其任务是通过计算机技术自动从文档中抽取出事件句,采用不同的技术组织这些信息,最终生成人们可以理解的文章摘要。在研究基于事件本体的自动文摘的过程中,本文进行了如下的一些有益探索:   (1)事件本体的构建。通过对事件本体的概念和事件六元组定义的理解,本文用本体构建工具Protégé构建了事件本体。   (2)利用事件本体中事件角色对事件句中的动词含义进行辨析和对事件句进行分类。   (3)综合考虑事件句的位置、时间和依赖关系生成自动文摘。   我们以哈尔滨工业大学信息检索研究室单文档标注语料为数据进行了实验,其结果表明:本文提出的基于事件本体的自动文摘方法能够对新闻报道、记叙文等单文档生成更加有效的文章摘要。
其他文献
双目视觉中的一个重点和难点就是图像匹配,图像匹配也是计算机视觉和图像处理领域的一个非常重要的研究方向。本文针对图像匹配方法进行了深入的研究,并提出了一种高效的图像
娱乐机器人是机器人领域中一支极具前景的新生力量,强调人机交互性和用户情感体验,具有让主人身心愉悦的特点。象棋机器人就属于娱乐机器人的一种。本文所介绍的中国象棋对弈
随着近年来智能手机的普及,以及无线传感器网络、众包计算、社会计算、机会网络研究的不断深入,移动群智感知这种新型的感知模式被提出,其理论和关键技术有了进一步突破的契
图像分割是把一副给定图像按照一定的分割标准分成各具特性的区域,同时将其中感兴趣的目标提取出来。图像分割的难点在于在保持同质区域一致性的同时获得清晰准确的分割边缘,
报表设计工具是一种可通过拖拽操作,灵活地进行表格、形式、样式设计,并可导入用户报表数据的软件工具。报表模板库是报表设计工具的重要组成部分,可支持用户方便地进行报表
图像增强是一种基本的图像预处理手段,它对于改善原始图像的图像质量和视觉效果有着重要作用。本文针对X射线胸片中肺节点图像增强算法进行了研究,提出了新的X射线胸片肺节点
在软件生命周期中,软件测试是较为耗费资源和时间的一环,自动化测试虽然可以提高软件测试效率,但效果仍然比较有限,且无法解决耗费资源的问题。随着云计算的产生与发展,其诸
工作流技术把企业的业务过程管理从应用系统中分离出来,为企业更好的实现经营目标提供了先进的手段。但在工作流带来高效率的同时,其安全性也面临严重的挑战。访问控制成为众
随着嵌入式技术的飞速发展,嵌入式计算机渐渐渗透到人们生活的方方面面,其中某些关键性的应用对计算机的可信性要求越来越高,传统的嵌入式系统已无法满足这样的要求。嵌入式
随着空间数据库技术的不断发展和人们应用的增长,空间数据的时域信息的研究越来越受到关注。在这种情况下,时空数据库的诞生成为了必然。然而时空数据量的庞大和非结构化性给