论文部分内容阅读
随着互联网技术的飞速发展,文档万维网已经转变成为语义网,使得表示语义网的知识图谱构建成为研究热点。尤其对于特定的领域,知识图谱是实现个性化服务的基础,因此,自动或半自动构建特定领域的知识图谱成为了进来研究的重点。本文针对特定领域的领域知识图谱构建中的关系抽取任务,主要做了一下几个方面的研究工作。1.领域实体层级关系抽取和组织。领域实体层级关系是知识图谱的骨架,实体的层级关系决定着知识图谱的深度。本文提出一种基于词向量的半监督的方法进行领域实体层级关系的自动抽取和组织。首先,采用基于词向量的相似度计算方法进行模式聚类,筛选出置信度高的模式对未标注语料进行上下位关系识别;然后采用Bootstrapping的方法进行迭代的关系实例抽取;最后,根据领域实体上下位关系对的向量偏移并结合领域实体层级关系的特点,采用映射的学习方法进行领域实体层级关系组织。2.领域实体属性关系抽取。领域实体间的语义关系是领域知识图谱的重要组成部分,实体间的语义关系决定着知识图谱的广度。对于特定领域来说,实体的属性关系是实体语义关系的重要组成部分。本文提出一种基于深度卷积神经网络的领域实体语义关系抽取方法。采用深度卷积神经网络自动学习表征领域实体属性关系的词汇特征、上下文特征以及实体所在的句子文本特征,构成特征向量,训练实体语义关系分类模型。3.领域知识图形化展示。领域知识是一个包括领域概念/实体以及它们之间关系的复杂网络,是一个很复杂的模型,传统的关系数据库很难表述这些复杂关系。本文提出一种基于图数据库Neo4j的领域知识图形化展示方法,将领域实体间的关系用图数据进行表示,实现领域知识的可视化。