面向网络百科和知识图谱的实体链接算法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yangliang0510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会步入大数据时代,互联网上出现了海量的自然语言文本数据。自然语言文本数据中蕴含着大量的知识,但文本数据组织形式不固定,传统方法难以准确挖掘这些知识。知识库是以一定的表示方式组织、管理和使用知识的工具,其中存储了大量命名实体及相关知识,典型代表有网络百科和知识图谱等。自然语言文本中往往含有大量的专有名词,对理解语句起着关键作用,这些专有名词被称为实体提及。实体链接就是找到自然语言中的实体提及在知识库中的对应实体的过程。通过实体链接,自然语言中文本中的大量知识就能得到充分挖掘,进而语义搜索、智能问答等下游应用都能得到很好的支持。根据知识库类型的不同,实体链接任务可以分为面向网络百科的实体链接和面向知识图谱的实体链接。面向网络百科的实体链接是将自然语言文本中的实体提及链接到对应的网络百科实体上的过程。面向知识图谱的实体链接是将自然语言文本中的实体提及链接到对应的知识图谱实体上的过程。本文针对现有研究成果的不足,深入研究了两种不同的实体链接任务,并取得了以下研究成果:(1)在面向网络百科的实体链接任务中,现有方法忽略了训练语料中部分实体提及对应的样本过少的问题,导致这些方法准确率低。本文提出将实体链接任务按照实体提及不同分为大量子任务,进而提出一种基于元学习的面向网络百科的实体链接方法Meta-EL,利用元学习算法解决部分实体提及的少样本问题。在该方法中,为了解决部分子任务的类不平衡问题,本文提出了基于集合编码器的自适应系数机制,动态调整不同任务的训练过程。在多个真实数据集进行实验评估的结果表明,与现有工作相比,本文提出的面向网络百科的实体链接算法显著提高了准确性。(2)在面向知识图谱的实体链接任务中,现有工作没有考虑实体提及上下文的语义依存关系,也没有充分利用知识图谱中的结构化信息,导致这些方法准确率低。本文提出了结合语义依存分析和图注意力网络的面向知识图谱的实体链接算法DPGAT。针对实体提及语境中的语义依存关系,DPGAT算法利用语义依存分析算法构建语义依存图,进而使用图卷积网络对语义依存图进行编码。针对知识图谱中的结构化信息,DPGAT在知识图谱实体的表示学习中引入了注意力机制,根据对实体语义的重要性赋予知识图谱中的结构化信息相应的权重。在多个真实数据集上的实验结果表明,与现有工作相比,本文提出的DPGAT算法,显著提高了面向知识图谱的实体链接任务的准确性。
其他文献
干涉测量技术因其被动式测量、测角精度高、作用距离远等特点在对距地面20-100km空域的临近空间低速飞行器定位上具有天然的优势,是当前的研究热点。本论文针对干涉测量技术在临近空间低速非合作目标定位中遇到的包括定位原理、定位误差分析、目标位置解算优化等问题,开展了理论分析和仿真验证研究,其主要内容如下:首先,介绍了干涉测量技术原理,概述了干涉测量技术在临近空间非合作目标定位的优势;给出了干涉测量定位
深远海养殖业的发展催生了养殖工船,工船养殖不仅使在离岸高海况海域开展海水鱼养殖成为可能,而且可推动我国新一轮海水养殖浪潮的兴起,助力我国水产养殖业向深远海发展,加快“海上粮仓”建设.养殖工船主要有通海型和封闭型两种类型.国信控股蓝谷公司已着手建造10万吨级封闭型养殖工船,开展将大型货轮改装成封闭型工船进行前期养殖大黄鱼中试.封闭型养殖工船是可移动的养殖工船,可根据大黄鱼生长发育适宜的生态环境以及不同季节选择深远海最适的几个海域进行游弋式养殖.封闭型工船养殖大黄鱼首先要解决的是养殖容量问题,由于没有相关的封
城市景观水体是城市人群居住环境中的重要组成部分,具有美化环境、保持水土、降低污染、提高人们精神享受的功能(李兴平,2015).近年来,城市建设和工业生产的快速发展产生了大量的生活污水、工业废水,使得城市水体富营养化严重、藻类大量生长,影响了水体环境.目前各级政府陆续加大对环境的治理与保护,城市景观水体的修复治理变得尤为重要.