基于多粒度语义匹配的知识图谱问答关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wangxiaomax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前的信息时代,互联网蓬勃发展,各种知识信息爆炸性增长,人们对快速、准确地获取信息的需求促使了自动问答技术的诞生,基于自然语言的知识图谱问答系统(KBQA)正是其中的一个重要分支,它可以自动回答知识图谱中包含事实的自然语言问题,更加精准,快速且答案简洁。近年来,深度学习的方法也在KBQA中得到了广泛应用,但由于现实世界用户提问的问题多样,自然语言复杂且难以处理,现有的KBQA技术仍存在一些不足,如忽略了原始信息,难以区分同名实体等。处理KBQA问题的关键在于实体识别和关系检测两个步骤。关系检测是其中的重要步骤。为了提升关系检测的效果,保留更多更全面的原始信息,提出了一种改进的基于多粒度语义匹配,使用长短时记忆网络和卷积神经网络的关系检测模型,该模型能够利用LSTM和CNN的优势分别获取语义级和单词级的匹配信息,模型左边的部分是基于不同关系粒度和层次的深度双向长短时记忆网络(Bi-LSTMs),用于从语义层面进行建模:首先提取关系的三个层次信息:relation-level、word-level以及与关系相关的主题实体类型,其次使用深度双向长短时记忆网络(BiLSTMs)来学习不同层次的问题表示,第三使用一种注意力机制来同时跟踪实体和关系,最后还运用了一种残差学习方法来完成问题和关系的层次匹配。模型右边则使用了基于三维卷积的卷积神经网络,从单词的角度上进行建模。为了检测这个模型的效果,还构建了一个简单的KBQA系统。实验结果显示,这个方法提高了关系检测的准确率,它帮助本论文中的KBQA系统在单关系(简单问题)和多关系(Web QSP)QA基准测试中都有了更好的表现。
其他文献
空地协同网络由立体空间多功能节点构成,面对多样化任务,承载多类型的动态业务。根据空地自组织协同场景下的不同业务请求,需要多速率匹配与自适应物理资源调度机制实现多业务信息融合通信。针对这一问题,本论文研究面向空地自组织协同的融合通信技术,设计了支持多速率的物理层融合通信体制,基于典型空地协同物理信道进行了多速率通信性能分析,给出了融合通信体制下的MAC层架构设计,提出了一种面向多业务速率匹配的自适应
随着智能终端和移动互联网的普及,世界已经进入智能制造和数字消费的时代。基于位置的服务已经渗透到人们生活的方方面面,在餐饮、物流、零售、制造、医疗、安防等行业有着广泛的应用前景。由于现代建筑的空间越来越大和结构越来越复杂,人们在室内所处的时间也越来越长。室内定位需求的增长使得室内定位成为定位技术研究的一个热点。基于CSI的分区指纹定位过程同已有指纹定位一样包含离线和在线两个阶段。离线阶段的第一个任务
知识抽取是指对数据进行检测、筛查并解析,获取其中的知识并存储到知识库的技术。情报分析系统中需要依据情报类别获取情报中发生的事件以及参与事件的实体,此时基于自然语言处理的知识抽取技术能够高效的解决这类问题。为了实现英文情报分析系统中实体、事件的抽取及展示,设计并实现了知识抽取算法,并结合前后端及数据库构建出完整的应用系统。首先介绍了知识抽取算法的开发背景,然后梳理了知识抽取技术的国内外概况,对项目实
短语识别技术在语义理解任务中扮演着十分重要的角色。短语识别技术对已经正确分词和词性标注好的句子,自动划分出不同单元块的短语,可以提升计算机对自然语言的理解能力,也对后续的深层的文本意图、情感分析等环节有很大帮助。为了得到准确率较高的短语识别模型,对用户输入数据进行了清洗,过滤其中无意义的符号,并按照不同类别符号切分单句;基于CBOW模型训练了word2vec中文词向量并随机初始化训练词性向量,拼接
传统中心化系统之间难以达成互信,难以实现信息数据共享,使用传统方法在中心化系统之间实现数据交互需要耗费大量人力与时间成本。区块链技术具有天然去中心化的特性,能够通过技术手段解决不同机构之间互信的问题,因此将应用迁移到区块链平台上能够减少人力与时间成本。从传统系统迁移到区块链系统时,存在数据交易顺序难判定、上链数据交易无法修改的问题。因此需要构建面向多方数据迁移的链上修复机制。设计了面向多方数据迁移
某大功率机车检修段现阶段机车转向架螺栓装配的工艺要求主要依靠纸质手册,为了提升螺栓装配效率,需要研究开发利用增强现实技术的机车转向架螺栓辅助装配AR系统。机车转向架螺栓众多且在装配时需要能将每个螺栓都进行识别和定位,现有的增强现实技术无法同时满足这两个要求,本文采用YOLOv3目标检测算法实现增强现实,研究了虚拟指示的稳定跟踪和螺栓装配作业正确性监管,主要研究内容如下:首先,研究了基于YOLOv3
随着微电子产品越来越多的被运用在生活当中,其核心技术嵌入式系统也成为了研究和开发的重心。嵌入式软件的开发技术以及开发环境又与嵌入式软件的质量和开发效率戚戚相关,一个良好的嵌入式集成开发环境能有效的简化开发过程,降低嵌入式软件的开发难度,极大的提高嵌入式软件的开发效率,因此,嵌入式集成开发环境的发展也至关重要。SDIC-C_IDE是一款C语言的嵌入式集成开发环境,具有C语言语法高亮、换行自动缩进的功
随着建筑物内部基于位置服务需求的日益增长,面向导航服务的室内地图开发成为地图设计领域中的研究热点。在室内导航应用中,为了快速检索导航位置点的信息和获取位置点的地理坐标,需要精细化设计室内地图的数据结构;为了提高室内地图的维护效率,需要简化室内地图的编辑操作,及时更新室内地图数据。针对以上需求,以某大学办公实验楼为研究对象,以室内地图数据结构和地图绘制工具为研究重点,实现了面向导航服务的室内地图系统
COStream是一种高效的数据流编程模型,它在编译过程中基于数据流图生成可在多核上并行计算的程序,内部分析过程对用户透明,程序开发简单,但作为一种新的编程语言目前还不够完善。在编译方面,编译器内部没有完整的符号表支持,在编译过程中无法通过分析由变量控制计算节点的调用来生成静态数据流图,限制了COStream的应用场景;在程序设计方面,COStream编写嵌套数据流程序的方式复杂,不够友好。针对C
在基于匿名P2P网络的分散式存储系统中,数据所有方失去了对数据的绝对控制,而低可信的存储方随时可能篡改或删除数据,因此数据的完整性受到了严峻挑战。为了解决数据完整性难以得到有效保障的问题,数据持有性证明(Provable Da ta Possession,PDP)成为了当下学术界的讨论热点。PDP技术使得数据所有方可以在低可信的环境下通过挑战存储服务器,验证其是否正确地持有存储数据。然而,现有的P