基于深度学习的资源实体及其关系联合抽取方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:qinqincy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
资源命名实体识别和实体关系抽取是对资源描述文本进行语义信息理解的重要基础,基于实体和关系可以构建出资源库和资源知识图谱,对资源的深入研究和充分利用具有重要的意义。当前实体识别和关系抽取通常采取基于统计或者基于人工神经网络的模型,目前研究都多是将这两个过程看成分别独立的模型,按顺序依次完成两个过程,由于两个模块有着相似的底层数据处理过程,因此这种方式易造成数据重复预处理,同时也存在错误传播的问题,实体识别阶段出现的错误实体会继续传递到关系抽取模块,影响实体关系的确定。针对当前问题现状,做了以下工作和创新:(1)为克服对人工特征的过多依赖,本文构建了基于深度学习和规则联合的资源实体及关系识别模型,通过基于Bi-LSTM的循环神经网络提取上下文特征,然后利用CRF完成实体识别,构建CNN模型完成关系抽取;由于规则匹配的方式有较高的精确率,本文将深度学习模型和规则模型优势互补,通过制定少量规则对深度学习模型识别结果进行补充和校验,以此提升精确率。(2)提出引入互反馈机制的混合神经网络模型来完成实体及其关系的联合抽取,一是实现两个模块共用相同的词向量转化和上下文特征提取过程,避免重复数据预处理过程,二是实现实体关系抽取对实体识别的反馈校验,以互反馈机制增强两个模型的关联性,抑制两个阶段的错误传播,提升整体识别性能;(3)定义了资源知识的表示结构,提出资源知识集构建算法,由此算法将抽取到的实体及关系生成便于存储和管理的资源知识集。将本文提出的算法应用在实体数据集上进行实验,在同等硬件和软件环境下,本文提出的方法可以缩短模型训练时间,实体及关系抽取的精确率、召回率、F1值均有提升,联合抽取的F1值整体提升3.91%,实体识别子模块F1平均提升1.34%,关系抽取精确率可以达到75.02%,F1值提升5.79%,对实体关系抽取的效果提升明显。实验结果表明联合抽取模型可以实现两个子模块的合并来降低数据处理时间和错误数据的传递,互反馈的机制可以提升整体识别效果。
其他文献
当前互联网和信息化时代飞速发展,“放管服”改革、事业单位改革和社会组织改革紧密锣鼓,经济社会发展进入新常态,社会治理主体由一元走向多元,多个主体共同参与成为了社会治
目的:环磷酸鸟苷(cyclic guanosinemonophosphate,cGMP)是一种调节心脏功能的胞内第二信使,通过细胞膜上的cGMP门控离子通道、cGMP依赖性的磷酸二酯酶(phosphodiesterase,PDE
语义分割任务的目的是根据输入图像的内容识别出图像中像素点的语义类别。作为智能场景理解的基础,语义分割具有重要的研究意义,现在被广泛应用于自动驾驶和机器人感知等领域。然而,由于现实环境复杂的光照变化和物体间的遮挡,语义分割仍然是一个具有挑战性的问题,仅靠单模态RGB信息难以对复杂场景进行精确分割。近年来,随着深度传感器的出现,人们开始对含有深度信息的RGB-Depth(RGB-D)图像展开研究。RG
随着课程改革的推进以及学科核心素养的确定,深度教学成为了教育学关注的热点领域。深度教学是指教师在学科核心素养培养的导向下,基于知识内在结构,设置恰当的教学情境,引导学生超越表层知识符号的学习、机械训练,走向知识内在的逻辑形式和意义领域的教学活动。通过深度教学能够促进学生深度学习,使得学生在教师的有效指导下获得关键能力,并发展高阶思维。因而,深度教学被广泛应用到各学科教学中。地理是一门综合性很强的学
目的分析急性缺血性脑卒中(Acute Ischemic Stroke,AIS)患者早期降压治疗的可行性。方法选取2017年8月至2018年1月我院收治的AIS患者120例为研究对象,采用随机数字表法将其分为A组、B组、C组各40例,分别于卒中后3 d、5 d、7 d采用降压药物治疗,分析三组收缩压(SBP)、舒张压(DBP)变化及神经功能[美国国立卫生研究院卒中量表(NIHSS)、改良Rankin
太阳能取之不尽用之不竭,因此通过将太阳能转换为电能是解决能源危机的最有效方法,而受到研究者们广泛关注的钙钛矿太阳电池具有光电转化效率较高,制造工艺较为简单等优点。而且常用于钙钛矿太阳电池吸光层的钙钛矿材料多具有吸光系数高,载流子扩散长度长,禁带宽度合适等特点。自从2009年Miyasaka组首次制备出光电转换效率达到3.8%的钙钛矿太阳电池,到现在钙钛矿太阳电池的光电转换效率以经可以达到认证的25
生化药品是指从动物的器官、组织、体液、分泌物中经前处理、提取、分离、纯化等制得的安全、有效、质量可控的药品。这类药品的原材料来源自生物体,因此,相比于化学合成药品,前者的成分更为复杂,在药品质量控制方面也存在很多难点,其中,明确制药所用原材料的动物来源是生化药品质量控制的第一步。因为不同动物来源的药品其药效可能存在一定差异,并且不同来源的动物制品滥用可能会导致人畜共患疾病的传播以及宗教冲突的发生。
目的:应用RT-qPCR技术检测大鼠骨骼肌挫伤后有ARE结构的mRNA(AREs-mRNAs)和无ARE结构的mRNA(non-AREs mRNAs)的表达量,探索有、无ARE结构mRNA表达异质性(个体间表达差异)之间
目的:对木丹颗粒联合卡马西平治疗缺血性脑卒中后气虚血瘀型丘脑痛患者用药前后的视觉模拟评分(VAS)、低密度脂蛋白(LDL)、脂蛋白相关磷脂酶A2(Lp-PLA2)、颈动脉内-中膜厚度(IMT)、斑块积分(PS)、中医证候积分进行观察,并评估其安全性,为中西医结合治疗该病拓宽思路并提供临床研究依据。方法:对60例符合本次研究纳入标准的受试对象按照随机数字表法分为治疗组30例、对照组30例。两组均采用
在经济高速发展的今天,中国城市建设的整体竞争力不仅体现在经济和技术的竞争,更体现在文化软实力竞争。如何塑造城市的个性化名片,打造城市独特的文化形象,这在当地城市的发展中也显得愈发的重要。“禹划九州,始有荆州。”荆州建城历史长达三千多年,是荆楚文化的发祥地,也是春秋战国时期楚国的国都所在地。1982年,国务院公布的首批24座历史文化名城,荆州位列其中。这里有着丰富的楚文化历史资源,体现出了荆州很高的