论文部分内容阅读
知识图谱是近几年提出的新兴技术,其概念一经推出,马上在学术界和工业界得到了广泛关注。由于知识图谱能够很好的表示知识之间的关联,因此将其应用于情报相关性分析领域也是一种必然,并且具有重要的现实意义。近些年针对知识图谱的研究中,面向知识图谱的关系挖掘和检索方法是研究的热点。特别是在大数据背景下,知识图谱中节点和关系的数量也是成指数级增长。如何更好的构建海量知识图谱,以及在大规模知识图谱上的挖掘分析一直是有待解决的难点。虽然学者提出了很多面向知识图谱的模型和方法,但都存在着计算复杂度过高、预测效果不佳等问题。因此,如何在海量知识图谱中进行有效的挖掘和分析,是当前研究的关键问题。本文针对情报知识图谱中关系推理和相关性分析两大任务,提出了改进的关系推理和关联性查询方法。在关系推理方面,本文针对传统方法在多关系预测方面的不足,采用了具有双向语义的无向图概率方法,来衡量关系路径的可靠性。并与嵌入式模型TransE联合构造关系推理方法。在关联性查询方面,本文提出了一种新颖的基于扩展的RDF知识图谱相关性检索方法。该方法思想在于使用关键词和权重扩展了原有RDF的表达方式,在权重的计算方法上考虑了数据分类对结果多样性的影响。并且在扩展的RDF知识图谱上提出了一种三元组相似度的查询松弛模型,相似度的计算采用一种语义重叠和图嵌入的混合评价方法。最后,利用三元组和关键词的权重对查询结果集进行排序,返回top-k个具有关联的查询结果。通过对比实验表明,本文提出的改进的关系推理模型在多关系预测方面,相对于以往的方法在预测准确率上有了明显提升。在关联性查询方面,其实验结果表明在召回率和准确率方面都有很好的提升。而且相对于传统的SPARQL查询,本文提出的方法克服了查询条件的限制,而且查询结果集具有较强的相关性和多样性。