基于神经网络的中文知识图谱问答研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:nofengy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是信息检索、人工智能和自然语言处理领域中的一项热门研究任务,并且具有非常广泛的发展前景。知识图谱问答是该研究的一个重要分支,即给定一个自然语言问句,问答系统从已有知识库中搜索相关的实体或文本作为该问句最后的答案。在理解问句和搜索答案的过程中,涉及到问题分类、实体提及识别、实体链接、候选关系识别和语义解析等多个自然语言处理任务。而问题分类是问题理解的核心环节,问答系统的质量直接受到分类精度的影响。候选关系识别是一种语义匹配任务,比较问题和候选关系的语义相似性,是答案搜索的关键步骤。本文基于神经网络的方法,针对中文知识图谱问答这一任务进行了相关研究,主要内容如下:(1)基于语言模型和注意力机制的中文问题分类针对中文问句的长度普遍较短、含有的语义特征信息较少以及疑问词在句中的位置不确定等问题,本文提出了一种新的分类模型。相比于传统的词嵌入模型,该方法借助最新的预训练语言模型进一步增强了问句中每个词的分布式表示,然后通过双向长短期记忆网络获取上下文的语义特征,最后利用注意力模型加强了对句子中疑问词信息的关注。在三份数据上的实验结果表明,提出的模型比基准模型可以获得平均3.63%的性能提升,体现了良好的分类性能。(2)基于语义相似度计算的候选关系识别方法传统方法大多是将句子看成是一系列分词的集合,通过计算句中每个词出现的频次来构建特征向量,然后使用余弦距离等评价方法比较句子相似度。然而这些方法仅仅考虑了句子中单词级别的特征,而不是语义级别,忽视了很多句法和单词顺序等重要信息。本文提出了一种新的神经网络框架,该框架基于孪生网络设计了多种注意力机制,实现了句子对之间的语义相似度匹配。实验结果表明,所提模型可以充分利用文本的语义信息,在CCKS2018语义匹配评测任务提供的数据集上F1值为84.59,排名第四。(3)基于多标签策略的中文知识图谱问答系统目前很多已有方法只能处理仅需一个三元组知识就能回答的简单问题,而对于问句中涉及到多个三元组知识的复杂问题却无法解决,包括多个实体和多个关系。本文提出了一个新的基于多标签策略的问答系统,该系统包含问题处理和答案搜索两个主要模块。在问题处理模块中,分别对问题的主题实体提及识别、实体链接和候选关系识别三个任务提出了不同的模型框架。借助多个标签的策略,将现有中文问句分成简单问句、链式问句和多实体问句。在答案搜索模块中,针对前面三种问题分别设计了不同的解决方案。实验结果表明,所提方法能够获得较好的性能,在CCKS2019-CKBQA公开评测数据的验证集上平均F1值为66.76,排名第二。
其他文献
糖尿病是世界上导致死亡和残疾最严重的疾病之一,而血糖浓度是糖尿病的重要指标。因此,精确监测和严密控制血糖浓度对于正确诊断和治疗糖尿病至关重要。传统上,一般采用酶葡
随着全球新能源汽车的飞速发展,电池相关技术也成为了研究重点。电池荷电状态(State of Charge,SOC)是电池最重要的参数之一,代表了电池剩余电量。电池SOC精确的估计可以避免
褐飞虱是一种喜温喜湿的远距离迁飞性害虫,尤其受温度和降雨影响较大。我国南方稻区是褐飞虱的主要危害区域,研究降雨对中国南方稻区褐飞虱迁入的影响,可为褐飞虱迁入的气象条件预报及进一步提高褐飞虱灾变预警水平提供科学依据。本文根据2006-2016年中国南方稻区105个植物保护站的褐飞虱灯诱数据和720个地面常规气象观测台站的逐日降雨资料,挑选出15个代表性病虫测报站点,利用ArcGIS空间分析工具及SP
目的观察人参皂甙Rg1对体外培养的星形胶质细胞划痕损伤后细胞表面相关蛋白(Nestin,GLT1,NG2,AQP4,GFAP,Vimentin)表达的影响及其可能的分子机制,并探讨其在脊髓损伤修复中的意义,为脊髓损伤的临床治疗提供新的思路。方法从24 h龄SD大鼠脑组织中取材获得星形胶质细胞(astrocyte,AS),进行体外培养、纯化及传代;免疫荧光法检测培养的AS细胞纯度,纯度达95%以上的
童书在现阶段已经成为我国图书出版业的支柱,而儿童文学图书又是童书市场中占比最大的一个部分。儿童的认知能力有限,在很长一段时间内,他们所阅读的图书都需要插图来解释和
目的:探究IL-Y在慢性移植物抗宿主病中的作用及其机制研究。方法:1、克隆小鼠IL-27p40和IL-12p28基因,并通过编码疏水性多肽接头(Gly4Ser)3的DNA序列连接小鼠IL-27p40和IL-12
高性能船舶因其优良的航行性能,强大的装载能力,舒适性和经济型是当今世界造船工业发展趋势,受到世界各地的研究机构的青睐。本文,我将使用CFD工具,STAR-CCM+对HYSWATH(双体
科技发展与时代进步需要能源作为动力,然而传统化石能源的使用导致环境污染问题愈演愈烈。当前各国集中力量发展清洁性新能源——氢能,然而氢存储问题极大地阻碍了氢能发展,实现安全高效的储氢方式迫在眉睫。多孔材料应用于储氢领域受到广泛关注,特别是金属有机框架物(Metal-Organic Frameworks,MOFs)。MOFs材料在低温下拥有良好的储氢性能,当温度上升到近室温时其储氢能力急剧萎缩,储氢质
秸秆类生物质中含有丰富的纤维素,将其作为底物进行微生物发酵是获得清洁能源生产的研究热点。但由于秸秆的低密度和高持水性,尤其玉米秸秆,使其在光发酵产氢过程中出现分层和结壳等现象。因此本文采用磁力搅拌和振荡两种扰动方式来增强产氢料液中各相浓度的均匀性,以氢气产量为依据,分析了不同扰动方式和扰动强度对玉米秸秆光发酵产氢的影响,实验结果表明:(1)不同搅拌转速对玉米秸秆光发酵产氢有不同影响。与静置培养相比
脑机接口技术的发展使得动物机器人引起了越来越多研究者的兴趣,得益于其自主智能、灵活性高、运动控制要求低和能源消耗少等优势,动物机器人在生物学研究、自然灾害预警、野