基于贝叶斯网的开放世界知识图谱补全

来源 :云南大学 | 被引量 : 0次 | 上传用户:jiu0703
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱作为海量数据的支撑技术,为搜索引擎、问答系统和推荐系统等应用提供知识服务,由实体以及实体之间关系构成的三元组是知识图谱的基础结构。为了丰富知识,传统的知识图谱补全方法以表示学习为基础,将实体和关系投射到向量空间,并通过向量之间的距离计算来构造更多的三元组。然而,现实世界中的知识在不断更新变化,这要求知识图谱能够及时增补有用的新知识。同时,数据中蕴含的知识也可以作为新知识的来源,对知识图谱补全具有重要意义。研究人员将所有不包含于知识图谱的数据称为开放世界数据,提出开放世界知识图谱补全方法,从数据中获取知识图谱中不存在的新实体,利用新实体构造三元组。然而,对于任意一个新实体,现有的开放世界补全方法每次只能构造一个三元组,在一定程度上限制了新知识的丰富程度。事实上,知识图谱中实体共同涉及的关系之间通常具有相互依赖的性质,基于这种依赖性可利用数据中的新实体来构造更多的三元组。贝叶斯网被广泛用于变量之间相互依赖关系和不确定性知识的表示和推理,为了给知识图谱补充更多的新知识,本文研究基于贝叶斯网的开放世界知识图谱补全方法。利用贝叶斯网表示关系之间的依赖性,针对从开放世界数据中提取的新实体,基于贝叶斯网概率推理来获取与新实体相关的其他关系,进而构造更多的包含新实体的三元组来完善知识图谱。本文的主要研究内容概括如下:(1)基于知识图谱构建贝叶斯网,有效表示关系之间的依赖性,作为开放世界知识图谱补全的基础。(2)提出基于贝叶斯网概率推理的三元组构造方法,从开放世界数据中获取包含新实体的三元组,并将这些三元组作为证据,通过贝叶斯网推理构造更多的三元组,从而实现知识图谱的补全。(3)利用三元组类型预测和链路预测任务对本文方法进行了实验测试,验证了模型构建方法的高效性和知识图谱补全方法的有效性。
其他文献
美国生态学家E.P.Odum提出生态学是“科学与社会的桥梁”的著名论断,但如何构建这个桥梁至今尚无定论。霍桑效应最重要的内容是指被别人观察的个人具有改变自己行为的倾向。自然保护区作为科研人员研究的热点区域,在当地社区居民意识到自己世代所生活的环境以及居民本身正被科研人员所关注、研究时,是否会有改变自己行为的倾向,这种倾向是产生正效应还是负效应,这种效应是否会更有利于自然资源的可持续管理。为此,本文
蒙古及周边地区位于中亚造山带中部,是中亚造山带的核心区域,该地区构造运动活跃,是显生宙以来陆壳増生和扩张作用最为强烈的地区。对蒙古及周边地区的重磁资料和热结构进行分析研究,并结合该地区地质、地震资料,来揭示其地壳结构和岩石圈热状态,对深入认识蒙古及周边地区的断裂分布、地壳结构和热分布等具有重要意义。本文根据高阶重力场模型SGG-UGM-1研究了蒙古及周边地区的自由空气重力异常和布格重力异常的空间展
洞穴滴水是降水补给在包气带内部气-水-岩三相综合作用的结果。在包气带的内部除了存在着溶蚀孔隙、微裂隙和层面等扩散流介质,还存在溶蚀大裂隙和管道流介质。岩溶过程在引导地下水沿补给路径向排泄点渗流时,这个路径的选择是具有一定层次性的:连通较好的大裂隙和管道提供了主要流动路径,而岩溶发育程度低的小裂隙和孔隙是地下水储存和交换的主要空间。由于大多数岩溶地层和张裂隙的不均匀性以及渗透的多变性,使得不同水文地
气候变化背景下,流域水旱问题凸显,理解和掌握洪旱事件的发生发展状态对社会经济安全及危害防治具有重要意义。雅鲁藏布江地处世界水塔、生态脆弱的青藏高原,其干旱演变不但对当地社会经济具有重要影响,还牵涉到青藏高原水资源利用与跨境水安全,是一个亟需研究的问题。本文利用雅鲁藏布江流域32个气象站点19552017年的逐日气象资料,计算各站点的SPI指数,分析流域干旱的时空演变特征;利用Copula函数确定干
生态系统受全球气候变化的影响,森林生态系统作为生态系统的一部分,其与气候之间的关系密切而复杂。气候的改变直接影响到树木生理生态过程。关帝山位于吕梁山脉中段,处于北方中部暖温带半湿润半干旱过渡区,有完整的植被垂直带谱,植被保护良好,树木生长受人为干扰较小。另外该区在一定海拔范围内有以青扦(Picea wilsonii)和华北落叶松(Larix principis-rupprechtii)为优势树种的
揭示气候变化背景下自然生态系统的响应,是地理学、生态学和环境科学研究的热点。高山植被生长在气候极端恶劣、土壤极端贫瘠的环境中,对气候变化响应最为敏感,能够捕捉全球气候变化影响的早期信号。西南地区生物多样性丰富,是我国重要的生态屏障区,高山植被面积占中国高山植被总面积的三分之一,研究其在未来气候变化下的响应显得尤为重要,对如何在发展经济的同时维护区域生态安全水平具有重要意义。本研究基于MaxEnt模
本文分别将2-巯基苯并恶唑、2-巯基苯并咪唑、4-甲基-2-巯基苯并噻唑杂环化合物接枝到氯球聚合物基体上,制备了PS-MBO、PS-MBI和PS-MMBT三种新型杂环聚合物吸附剂,用于氯化介质中,从Pd(II),Pt(IV),Rh(III),Cu2+,Ni2+,Fe3+,和Zn2+的混合溶液中选择性回收Pd(II)。对最佳吸附pH值,最大吸附容量,混合离子分离条件等关键吸附分离参数进行了研究,对吸
作为Banach空间重要的一个组成部分—Musielak-Orlicz空间。其理论既为一般泛函分析提供了直观背景材料,又在许多领域中得到直接应用。例如在应用数学、物理学方面的研究都起到巨大作用。因此,通过学者们不断的深入挖掘其空间的特性,使得Musielak-Orlicz空间理论得到了重大的发展,并为今后的研究奠定了基础。本篇论文主要对Musielak-Orlicz序列空间和Musielak-Or
学位
中国常年遭受着外来物种的入侵,会对生态多样性造成破坏并影响农林业等经济方面的发展。在中国遭受的外来入侵植物中,紫茎泽兰是最典型的例子之一,目前国家已采取各种各样的方法来对其进行防控。检测作为紫茎泽兰防控过程中的关键步骤,如何准确地识别、检测定位出紫茎泽兰是亟待解决的问题。论文针对复杂背景下的紫茎泽兰数据集,提出基于深度学习的目标检测方法对紫茎泽兰进行分类和定位研究,所做的工作包括以下几个方面:(1
黄金不但在人类社会的经济活动中发挥重要作用,也广泛应用于电子、催化、电镀和燃料电池等工业领域。由于自然矿产资源的不断枯竭以及人们对黄金需求的不断增长,从低品位材料中回收黄金变得越来越重要。因此,研发从低浓度含金氯化溶液中高效提取金的技术具有十分重要的现实意义。溶剂萃取法从盐酸介质中萃取低浓度金需使用大量的有机溶剂。许多有机溶剂能够燃烧、挥发性强,使用有中毒的风险,还会对环境造成污染。针对溶剂萃取技