【摘 要】
:
随着互联网络和信息高速公路的兴起,每天都有大量的电子数据文件产生和进行交流。这种情况下,如何快速、准确地从信息的海洋里获取所需要的信息成为了信息处理研究的一个重要
论文部分内容阅读
随着互联网络和信息高速公路的兴起,每天都有大量的电子数据文件产生和进行交流。这种情况下,如何快速、准确地从信息的海洋里获取所需要的信息成为了信息处理研究的一个重要课题。信息抽取就是一种新的信息处理技术,其目的是根据预定义的模版,从半结构化文本、非结构化文本中抽取特定的信息。信息抽取系统不仅能帮助人们方便地找到所需信息,而且信息的内容经过合理的分析和组织后,人们可以高效地获取所感兴趣的信息。本文提出了一种基于Ontology的产品信息抽取系统,文中分析了信息抽取系统的体系结构、信息抽取的关键技术、信息抽取的分类及衡量指标。本文中详细介绍了系统的总体框架,详细描述了系统中主要模块的设计与实现,包括数据结构,数据库设计,流程图等。最后,进行了系统的信息抽取实验,并对抽取结果进行了分析与总结。本文在分析了大量的本体语言和计算机领域知识后,人工构建了一个计算机本体;在参考了ApplePie语法分析工具后,设计并实现了一个语法分析器,用于对非完全结构化文本进行分析,将复杂文本简单化,将多语义信息分类处理;提出了一种新的抽取方法,即把信息抽取和Ontology结合起来,先对文档信息进行语法分析预处理,然后利用领域Ontology里的概念、关系、关键字等生成抽取规则对处理后的文档进行信息抽取,最后把抽取的结果以记录的形式输出。系统信息抽取实验结果显示,基于本体的信息抽取系统抽取结果的F值(召回率和准确率的加权几何平均值)有显著提高。
其他文献
自然界中任何事物都包含着时态属性。所有信息都隐式或显式地具有相应时态特征。随着计算机应用技术的深入和发展,对时态信息显式处理需求越来越迫切。时态数据库就是显式处理
Web内容越来越丰富、复杂,在面对精确的、个性化的用户需求,与移动设备小屏幕不能显示有太多内容的网页,传统地把整个页面作为一个基本的信息获取与处理单位方式效率显得低下。
随着信息化程度的不断提高,数据对于企业的重要性凸现,存储技术在其中起到的作用日益增加,而网络技术的发展以及数据量的飞速增长,需要新的存储网络技术适应现有的网络存储环
三维人体运动跟踪是近年来机器视觉领域一个十分重要的研究方向,其应用领域相当广泛,如人机交互、智能动画合成、视频监控等。目前有关三维人体运动跟踪的研究大多基于多目视
知识表征和基于知识的推理是人工智能领域的重要研究内容,合理的知识表征方法和推理机制有助于提升智能系统解决问题的能力,尤其是当问题具有领域不受限的特征时。然而,传统
随着计算机网络应用的普及,网上商务活动的广泛开展,计算机系统的安全问题日益突出。入侵检测如今作为一种积极的主动安全防护技术,对于它的研究倍受大家重视。入侵检测提供
近年来,网格技术尤其是数据网格快速发展,为网格环境带来了大量的数据。网格数据以共享为主要目的,有着海量、异构以及分布性的特点,传统的数据管理模式无法很好的解决这些日
随着宽带网络的普及和多媒体技术的不断发展,数字视频在人们的生活中变得越来越重要。但由于网络带宽的限制,数字视频业务的发展遇到了瓶颈。2003年3月由联合视频专家组(JVT)
近年来,基于文件共享,流媒体组播,网络协作等应用的P2P网络技术得到了越来越广泛的应用。传统的网络结构形态如C/S模式、CDN、IP组播等,在系统的可扩展性、可靠性和经济性等方面
随着网络技术的不断发展,网格不仅符合OGSI规范,扩展了Web服务技术,秉承了Web服务的优点,而且加入了服务实例的可控性和服务状态等特性。网格服务不仅改善了传统分布式系统的集成