论文部分内容阅读
现有黄页检索系统采用基于关键词的信息检索方式,对要检索的信息只是基于语法层面上字、词的简单匹配,缺乏对语义的表示、处理和理解等能力,也即缺乏必要的智能性,导致检索质量低下,在信息快速增长的今天,难以解决查找信息困难的问题,不能适应时代发展的需求。把现有的黄页查找机制从目前基于关键词层面提高到基于语义层面,是黄页检索领域所面临的挑战。
本文通过对目前黄页检索的分析研究,提出了基于语义web的语义黄页检索体系框架-Syellowpage,该系统能充分发掘各企业之间蕴含的关联关系,满足用户对资源对象语义检索的需求。
本文在对Syellowpage中所涉及的若干关键技术包括本体构建、语义标注、语义推理等研究分析的基础上,提出了适用于黄页的技术解决方案。结合石油产品领域及我国的部分地域,构建出了黄页领域本体,提出了一种新的本体与文档的语义相关性算法,并应用该算法对检索结果进行了排序。该方法综合考虑了本体中与查询词相关的词汇对相关性的影响,使得检索结果尽可能靠近查询词主题,而不是机械的查询词匹配。实验表明,与传统基于关键字的黄页检索,Syellowpage在查准率方面有所提高。