基于混合神经网络的实体关系抽取方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yatang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取是信息抽取领域的重要研究内容,对知识库的自动构建起着至关重要的作用.针对非结构化文本实体关系抽取存在上下文环境信息难以准确表征,致使现有抽取模型准确率不能满足实际应用需求的问题,该文提出了一种新型的实体关系抽取模型BiGRU-Att-PCNN.该模型是基于混合神经网络,首先,构建双向门控循环单元(BiGRU)以更好地获取文本序列中的上下文语序的相关信息;然后,采用注意力(Attention)机制来达到自动关注对关系影响力高的序列特征的目的;最后,通过采用分段卷积神经网络(PCNN),从调整后的序列中较好地学习到了相关的环境特征信息来进行关系抽取.该模型在公开的英文数据集SemEval 2010 Task 8上取得了86.71% 的F1值,实验表明,该方法表现出了较好的性能,为信息抽取领域实体关系的自动获取提供了新的方法支持.
其他文献
基于人工智能技术的人机对话系统在人机交互、智能助手、智能客服、问答咨询等多个领域应用日益广泛,这极大地促进了自然语言理解及生成、对话状态追踪和端到端的深度学习模型构建等相关理论与技术的发展,并成为目前工业界与学术界共同关注的研究热点之一.该文聚焦特定场景下的任务型对话系统,在对其基本概念进行形式化定义的基础上,围绕着以最少的对话轮次来获得最佳用户需求相匹配的对话内容为目标,针对目前存在的复杂业务场景下基于自然语言的用户意图的准确理解和识别、针对训练数据的标注依赖及模型结果的可解释性不足,以及多模态条件下对
T ransC是一种高效的知识图谱嵌入方法,通过区分概念和实例来建立概念、实例及关系的嵌入.T ransC将概念编码为球体,球体半径被随机初始化并在训练中迭代更新.由此导致模型出现两个问题:一是训练得到的部分球体半径与模型训练目标不符;二是忽略了概念本身提供的语义信息.针对上述两个问题,该文提出了T ransIC模型,首先,基于IC参数给出新的概念球体半径求解方法,使求得的半径满足T ransC目标,并且丰富了概念嵌入向量的语义信息.其次,该模型以T ransC为基础,在概念编码阶段引入基于IC参数的概念
根据回转盘铸铁件的结构特征,通过数值模拟分析及优化,确定了分型面选于铸件的大平面处;浇铸位置选择大平面朝上,精度要求较高的燕尾导滑面朝下;内浇道设置于铸件长度方向一端的侧面底部和顶部表面处,采用阶梯浇注并结合倾斜浇注的方式进行浇注;在倾斜浇铸位置的最高处侧面设置明冒口,以利于集渣和出气;在大平面顶部较厚部位热节处设置冷铁以保证此处结晶质量;在主型芯里埋填管状芯骨利于排气和搬运的铸造工艺.生产表明本铸造工艺既保证了底部燕尾导滑面和顶部大平面的组织质量要求,大大地减小了后期加工工作量,还使造型简单,具有较高的
双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用.由于汉语、老挝语平行语料稀少,且老挝语在语义表达、句子结构上与汉语有明显差异,导致汉老双语句子相似度研究的难度较大.该文提出了一种融合文本特征的汉老双语句子相似度计算方法,并构建了句子相似度模型.首先,在句子相似度模型中将汉语、老挝语的词性、数字共现等文本特征与GloVe预训练词向量融合,以此丰富句子特征,提升模型计算准确率.其次,由基于自注意力的双向长短时记忆网络组成多层孪生网络来提取长距离上下文特
话题的延续和转换是篇章中重要的语用功能.该文从句首话题共享的角度对话题延续和转换进行了分类,分为句首话题延续、句中子话题延续、完全话题转换、兼语话题转换、新支话题转换五种,进而对话题转换的特殊情况——新支话题展开研究.基于33万字的广义话题结构语料库,该文对新支话题的句法成分、语义角色进行了统计和分析.通过句法成分分析发现,宾语从句或补语从句主语、主谓谓语句小主语、状性成分起始句主语、句末宾语、连谓句非句末宾语、兼语句兼语、介词宾语甚至状语等都能成为新支话题,从而引出新支句,其中,句末宾语作为新支话题的情
关系抽取作为信息抽取的子任务,旨在从非结构化文本中抽取出便于处理的结构化知识,对于自动问答、知识图谱构建等下游任务至关重要.该文在文档级的关系抽取语料上开展工作,包括但不局限于传统的句子级关系抽取.为了解决文档级关系抽取中长距离依赖问题,并且对特征贡献度加以区分,该文将图卷积模型和多头注意力机制相融合构建了图注意力卷积模型.该模型通过多头注意力机制为同指、句法等信息构建的拓扑图构建动态拓扑图,然后使用图卷积模型和动态图捕获实体间的全局和局部依赖信息.该文分别在DocRED语料和自主扩展的ACE 2005语
回顾了中国普通炉衬冲天炉1958年至2008年之间的发展历程,包括土铁熔炼技术、前炉回气二次送风冲天炉、大型水冷冲天炉、冲天炉加料机、多宝冲天炉、曲线炉膛冲天炉、卡腰冲天炉、密筋炉胆冲天炉、中央送风冲天炉、两排大间距冲天炉、普通冲天炉的标准化等.本文对中国铸造工业史的研究者有一定参考价值.
本文以转K6型转向架摇枕为研究对象,通过超声波探伤检测、射线检测、解剖等检测手段找到摇枕内部密实度易出缺陷部位,对工艺进行了分析和选择,提高了摇枕内部密实度质量.
本文以某型号压缩机盖板铸件的铸造工艺改进为例,介绍了压缩机盖板类产品的一种铸造工艺设计思路和方法.针对铸件缩松问题,通过调整铸件浇注方向,修改浇冒系统,同时采用Magma软件对新工艺进行模拟验证,缩松问题得到有效解决,使此类铸件加工后的废品率从40.5%降低到8.3%.
阿里巴巴集团以面向海量商品数据智能化理解为目标,针对“千亿级商品知识图谱的构建及产业化应用”开展全方面、系统化的研究工作.通过在知识图谱技术上的创新与落地,完成面向千亿商品数据的图谱构建以及服务建设.在此期间,该项目提出了“低资源知识图谱构建技术”、“可微可解释知识推理技术”及“大规模高噪音文本训练数据下的知识获取技术”三个主要的知识图谱核心技术,形成了一套领先的知识理解、知识抽取、知识服务的技术体系.
期刊