基于语义属性特征图的查询扩展方法研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:qzzp666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今信息爆炸的互联网时代,尤其是移动应用的不停使用,产生了大量的信息,更有海量的用户群体,如此,因特网所涵盖的信息远远大于任何传统媒体所涵盖的信息,海量用户更是从各种角度、以各种的逻辑方式展开个性化的信息检索,如何在浩如烟海的信息资源中快速、准确地找到最需要的信息,是对现有的信息检索技术的一项挑战。当前主流的搜索引擎是基于单一输入框的,即基于关键字的查找,通常用户提供比较短的查询语句,并不能完整而详细地描述用户的需求,就此,查询扩展成为解决这一问题的热点。现有的查询扩展技术,不论是使用WordNet还是使用本体知识库,语义都是它们共同的缺陷。  针对查询扩展忽略语义的问题,本文提出了一种基于语义属性特征图的查询扩展方法。其中一个重要概念就是关联数据(Linked Data),它通过网络把以前没有关联的相关数据连接在一起,利用资源描述框架(RDF)图模型形成链接开放数据云(Linked Open Data Cloud),关联数据虽然本身并不具备语义特征,但它可以在数据层面建立跨领域的关联,成为查询扩展一个新的研究方向。  该方法将语义网、关联数据技术以及图的思想相融合,以DBpedia为数据源,通过构建以资源为顶点的语义属性图,挖掘更多关联的语义信息,更全面的实现扩展。首先,通过有监督的学习训练方法,数据挖掘出语义属性特征的权重值,用于表达扩展资源的有用性;然后在整个DBpedia图上通过标签属性实现查询关键字到匹配资源的映射,实现自然语言的关键词与关联数据知识的匹配,进而完成数据的抽取与预处理过程;接着,根据属性特征广度搜索出邻接点,并将其作为与关键词语义上相关联的词,即扩展候选词;最后通过设定的阈值,过滤、筛选出词相关性分值score最高的作为最终扩展词。  本论文实验数据下载DBpedia3.9的部分数据包,训练测试集选用Freitas、Augenstein等人共用标准,实验表明,与Augenstein的LOD Keyword Expansion方法相比,基于语义属性特征图的扩展方法召回率(Recall)达到0.89,平均逆排序(MRR)提高4个百分点,与用户查询需求更匹配。
其他文献
随着WWW发展和地理信息系统技术在几乎所有领域的应用,WebGIS得到快速发展。无数的组织、机构拥有数量巨大的地理数据,然而这些数据却以不同格式存在。目前大多数的商用数据格
网格是继传统因特网、万维网之后的第三代互联网应用,它是集成的计算与资源环境,其核心是网格消除信息孤岛,实现资源共享(包括计算资源、存储资源、通信资源、软件资源、信息资
继瑞典于1989年建立世界上第一个国家顾客满意度指数测评体系之后,世界各发达国家也纷纷建立了具有自己特色的顾客满意度指数评价体系,作为衡量经济增长质量的客观经济指标。基
Internet的迅猛发展,造就了人类历史上最大规模的分布式海量信息资源库。搜索引擎应运而生,为人们利用网络资源提供了有效的工具,但其自身的不足之处也显露无遗。用户常常无法准
随着数据和数据库的规模急骤增长,如何把数据变换成有用的知识是科学家亟需解决的问题,数据挖掘技术正是在这样的背景下应运而生的。数据挖掘被定义为从大量的数据中提取隐含的
随着科学计算可视化技术和地质信息计算机模拟技术的发展,将可视化技术应用于地质勘探和数据处理中,为地质工作者在3D空间中观察、分析地质现象以及空间分布提供了新的方法和手
短短几年,P2P应用己发展成为工nternet“带宽杀手”,越来越多的人开始使用P2P系统,越来越多的P2P应用被建立。组成P2P系统的节点并不固定,系统必须应对节点频繁的加入和离开,防止
阵列感应测井仪是近几年推出的一种新型感应测井仪器,阵列感应测井具有测井信息多,资料处理复杂等特点。为了更好地利用这类测井资料,本文综合利用测井新技术及面向对象的软件工
本文先从电信企业网网络安全管理策略要求的角度出发,引出实施网络安全域划分所面临的问题:隔离问题。然后一方面紧紧抓住VPN技术逻辑隔离这以技术特点,对MPLS VPN和VPDN (Virt
本文所介绍的基于单幅图像恢复物体三维形貌方法根据单幅图像中场景的灰度变化就可实现0180的三维形貌恢复,其核心思想就是根据单幅图像中物体留下的3D线索—阴影来恢复物体的