论文部分内容阅读
随着计算机网络技术和互联网的迅速发展,信息资源正在呈几何级的爆炸性增长。伴随着信息资源的泛滥,人们发现传统的信息检索途径已经愈来愈难以快速的检索到自己所关心、所需要的信息知识。而随着情报学与信息处理技术的发展,知识服务正逐渐取代信息服务成为情报学界的一个新的研究方向。知识服务的发展需要知识仓库予以支持,而知识仓库的构建需要自然语言处理、文本挖掘等多种学科技术的支持,而近年来随着这些技术的发展使知识仓库的具体构建成为可能。因而,本文从知识服务的角度出发,针对文献资源中重要的一种资源期刊文献构建了知识仓库,从而可以为用户提供期刊文献知识服务。首先,本文给出了国内外针对知识仓库这一知识领域的研究现状,进而将本文的研究对象定位为期刊文献资源,然后则对于构建期刊文献知识仓库中的主要技术进行了相关分析,这些技术主要包括:自然语言处理技术、文本挖掘相关技术以及数据仓库相关技术。其中自然语言处理技术主要采用的是HNC理论,该理论在中文自然语言处理中处于领先水平,为自然语言处理提供了新思路。在这些技术理论指导之下,本文通过对于期刊文献基本结构的分析,提出以文献知识元表示文献基本知识,并用六元组来表示期刊文献知识元。然后则在知识元六元组的基础上详细的设计了期刊文献知识元的抽取方法以及基于六元组的知识元存储结构,进而构建了期刊文献知识库。在构建的期刊文献知识库的基础上,本文则继续设计了从知识库中抽取期刊文献知识元的具体方法,并设计了期刊文献知识元的转换和集成方式,设计了仓库的基本架构与存储结构进而构建了期刊文献知识仓库。最后则详细的分析讨论了期刊文献知识仓库的应用,主要包括知识元的查询展示,知识元链接的可视化以及知识挖掘服务。本文的主要目的便是针对期刊文献资源,提出了一种知识仓库的基本架构以及知识仓库的具体构建流程,从而为人们提供期刊文献知识服务。本文的主要特色便是提出了一种新的文献知识元表示方式,设计了一种切实可行的知识仓库架构,为知识仓库的构建研究以及知识服务研究提供了新思路。