论文部分内容阅读
传统信息检索方式下,由于信息资源缺少统一的语义描述,用户难以快速查找到与需求相关的资源,难以实现信息资源的语义共享。如何使信息资源具有应用程序可以理解的含义,并根据信息资源所具有的领域知识,实现信息资源的语义检索,提高数字化信息资源的利用率,是传统信息检索领域所面临的挑战。 语义万维网是万维网的发明人Tim Berners-Lee倡导的下一代万维网,旨在赋予万维网上所有资源唯一的标识,并在资源之间建立起机器可处理的各种语义联系。语义万维网是对当代万维网的扩展和延伸,能够以一种明确的、形式化的方式来表示信息资源,提高异构系统之间的互操作性,促进知识共享。 本文通过对传统信息检索的基本原理、技术及发展现状等方面的分析研究,结合语义网的具体特点,提出基于领域知识的智能信息检索体系框架,详细描述了智能信息检索系统的设计思想和检索流程,并对系统合理性进行了论证。 首先,根据机器理解语义的需要,借鉴知网和领域本体的思想,提出领域知网的概念,来辅助领域本体表达领域知识,并给出领域知网的结构、特点和作用; 其次,针对传统信息检索技术的缺点和不足,提出利用领域本体和领域知网来构建领域知识网络,表达领域知识的新思想,并给出基于这种领域知识表达方式的智能信息检索系统的框架结构及工作流程; 再次,深入研究了智能信息检索系统框架中所涉及的领域本体构建、语义分析、语义推理等关键技术。总结本体的开发方法,通过分析比较提出适合领域本体和领域知网的开发方法,并以历史领域为例,开发历史领域本体和历史领域知网来表达历史领域知识;提出结合领域本体和领域知网进行语义分析的方法及算法实现,并在前人所做研究的基础上,对概念相关度和概念相似度的计算进行改进,应用到语义推理的过程中。 最后,提出基于领域本体和领域知网所表达的领域知识的智能信息检索系统的模型,以历史领域为例,借助Protege3.1.1、Jena开发试验系统,并简单分析结果。