基于本体的概念语义相似度研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:amwygah021121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web作为目前Web的一个延伸,目标是使Web上的数据具有机器可识别的语义,便于人机之间的交互与合作。然而其实现面临着语义互联、规范组织和智能聚合等理论和技术障碍。为了探索解决问题之道,本文设计了一个语义原生XML数据库系统(简称SNAX系统),对其中的一些关键理论和技术进行了详细的设计并对语义相似度计算器进行了实现。SNAX系统的层次关系满足Bemers-Lee对语义Web的定义,能够用于构建此系统的许多理论、技术和方法对构建语义Web有同样的作用。 首先,论文对Tim Bemers-Lee提出的语义Web体系结构进行了简介,在总结了语义Web实现所面临的理论和技术障碍的基础上,提出了本文的研究方向,设计一个微型的语义Web系统——SNAX,其主要组成部分有:Web数据采集器、数据存取管理器、本体映射集成器以及多功能查询器。 其次,从Web信息采集和本体集成两方面论述了语义相似度计算在SNAX系统中的重要地位和作用。论文基于“建议上层共享知识本体(SIYMO)”提出了语义相似度的计算方法,该方法通过对SUMO层次树中处于不同位置的边设定不同的权值,按照最短路径距离的计算方法得到两个概念的语义距离,然后进行间接转换,得到了两种不同的语义相似度计算方法。 最后,对本文提出的算法进行评估。在SUMO中随机选择了五十对概念,通过文中实现的相似度计算平台得到了两种计算方法下的实验结果,同时我们获取了人类主观判断的结果,通过比较分析它们的吻合程度,确定了能得到最佳结果的参数值,从而验证了方法的有效性。
其他文献
模式识别的主要任务就是利用样本中的特征,将样本划分为相应的模式类别。通常情况下,样本特征中包含了足够的类别信息,才能通过分类器实现正确分类。为了提高模式识别的正确
近几年来,我国对医保问题高度重视,医保管理体制不断完善,基本实现了“人人享有基本医疗保险”的目标。随着医疗保险管理系统的运行,系统中的数据量将会逐渐变得庞大。由于医疗保
行为分析是视频理解的重要研究内容之一,它通过分析处理监控场景的图像、视频,获取监控场景的信息或场景中运动目标的信息,并对这些信息进行行为分析和高层次的语义描述,在智能监
随着信息技术的发展,互联网中的数据呈现出数据爆炸的趋势,其中所包含的各种信息越来越多,互联网已经成为了人们获取信息的一个主要渠道。然而,用户有的时候只是知道自己所要
利用全色多光谱遥感图像对道路进行自动识别与提取,是近年来研究比较活跃的领域之一,它对城市规划、交通管理、灾害监测都有着重要的实际意义。早期遥感数据因为技术限制,大多是
企业应用集成(EAI)是指通过企业内部网络连接在一起的应用程序和数据源来实现数据和业务的自由共享。由于早期开发的软件系统从规划和技术架构上都没有从整个企业的信息架构
遗传算法(Genetic Algorithm——GA),是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,它是由美国Michigan大学的J.Holland教授于1975年首先提出的。J.Holland教授
为了充分利用企业现有的IT资源,整合企业中计算机孤岛式的应用,向集成化、协作式的方向发展,降低企业管理成本,使资源效益最大化等,很多企业构建了自己的工作流管理系统。这
随着中国经济的蓬勃发展,面向中小企业的信息系统软件市场一片繁荣,但是当前这类信息系统的开发过程仍旧存在诸多问题──工期长、软件质量低,没有完善的配套质量保证手段等
随着数字电视、网络视频流等技术的飞速发展和广泛应用,对数字多媒体信号的存储,处理以及传输的要求变得越来越高,视频压缩技术逐渐成为媒体、广播的最基本组成部分。另一方面,近