论文部分内容阅读
本体具有良好的概念层次结构、支持逻辑推理,因而在信息检索领域得到了越来越广泛的应用,大大提高了信息检索的查全率和查准率。在此研究背景下,本文针对本体的半自动构建进行了深入研究,目的在于构建一个可应用于专利检索系统中的领域本体,通过本体在系统中的应用来提高系统检索效率、增强与用户的交互性以及实现专利情报的发现。本文主要工作内容如下:首先,通过对国内外著名专利检索系统的调研,总结得出专利检索系统尚可进一步完善的三个方面:检索效果、与用户的交互性、专利情报发现,确立了在专利系统中构建并应用本体的目标。然后,提出了一种构建专利领域本体的方案,对本体构建的难点问题——概念的获取、概念间关系的获取提出了解决方案,设计了专利检索系统中本体的半自动构建,按照本体构建的顺序将系统分为三大功能模块:构建本体雏型模块、概念发现模块、关系发现模块,对这三个模块进行了设计并实现。在本体半自动构建的概念抽取过程中,提出了单个词语在多个文档中权重计算的解决方法,用以计算获得领域内专利信息的主要特点特征。在已有专利检索系统的基础上设计并实现了基于本体的专利检索,最后通过对基于本体的语义检索方式与基于关键字匹配的检索方式进行检索效果对比,前者检索结果的查全率、查准率比后者有所提高,在结果显示、专利情报发现方面也有所改进,实验证明本文所提出的本体半自动构建方案可行,本体在检索系统中的应用在一定程度上完善了系统。