基于神经网络的事件同指消解方法的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:ctrl111shift
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件同指消解是信息抽取领域中的重要课题之一,有助于理解文本信息和发现事件之间的相互联系,在信息抽取、智能问答、机器阅读理解等领域有着重要的应用价值。目前,同指消解研究主要集中在实体同指消解,针对事件同指消解的研究较少。由于事件的表达形式灵活以及篇章内事件间关系复杂,事件同指消解任务具有挑战性。事件同指消解分为文档内事件同指消解及跨文档事件同指消解,本文主要针对文档内事件同指消解技术展开深入研究,主要研究内容包括以下三个方面:(1)针对现有的事件同指消解方法无法很好地挖掘事件深层语义的问题,本文提出基于多可分解注意力机制的事件同指消解方法。首先,根据同指事件的语言学特点采用了多种语义特征;其次,使用可分解注意力对特征加权,在提取其中的相似信息的同时过滤大量的无关特征及干扰信息,并利用神经网络相似度模型来判断事件对是否同指。最后,使用全局优化方法消除了模型中的冲突结果。在ACE 2005和KBP语料库上的实验表明该方法在多个指标上优于多个基准系统。(2)针对大部分事件同指消解研究过于依赖标注信息的问题,本文提出了一种基于未标注生语料的事件同指消解方法。首先,提出了一种事件同指消解框架,包含事件抽取、真实性识别以及事件同指消解三个部分;其次,使用卷积神经网络和循环神经网络等从生语料中进行事件抽取,抽取出事件以及相关事件属性;最后,针对生语料缺乏相关标注特征的问题,本文使用门控卷积和注意力机制编码事件,提取事件结构中的深层特征,并得出同指结果。在KBP 2015以及KBP 2016语料库上的实验表明该方法在多个指标上优于多个基准系统。(3)针对现有的事件同指语料库规模小,造成深度神经网络容易过拟合的问题,本文提出了基于远程监督和强化学习的事件同指消解方法。首先,建立基于多头注意力机制的相似度模型作为事件同指消解的基础模型;其次,在大规模无监督语料库中采用远程监督方法使用该基础模型来标注数据;再次,针对自动标注数据错误率较高的问题,使用强化学习机制设计了一种样本选择器,通过筛选远程监督数据集的样本,提升了远程监督数据集的数据质量。本文提出的数据扩充的方法无需人工干预,所有的工作都可由机器自动完成。在KBP 2015以及KBP 2016语料库上的实验表明该方法在多个指标上优于多个基准系统。本文针对事件同指消解任务中存在的问题,提出了三种有效的事件同指消解方法,大幅提升了事件同指消解的性能,这些方法在学术研究和实际应用中有着良好的研究价值。
其他文献
背景:胰腺癌是我国常见的恶性消化道肿瘤之一,其中导管腺癌占胰腺癌的85%。目前手术根治性切除是对于胰腺癌最有效的治疗手段。据报道,80%的患者在诊断为胰腺癌时,因其已经发
目的:(1)探究出核抑制剂来普霉素B(Leptomycin B,LMB)诱导急性早幼粒细胞白血病(APL)细胞内PML核小体形成过程中关键的参与蛋白。(2)进一步探究在APL细胞中该参与蛋白是如何使弥散分布的PML蛋白及PML-RARα融合蛋白重组为PML核小体,从而阐明LMB诱导APL细胞PML核小体形成的分子机制,为临床治疗APL提供新思路及新方法。方法:(1)将急性早幼粒细胞白血病细胞株(N
目前,氧化铟锡(ITO)薄膜应用越来越广泛,在显示器、太阳能电池等高科技领域有着不可取代的地位。我国的铟资源储量丰富,且生产工艺趋于成熟,但产品较为单一,缺乏多元化发展,
随着移动机器人市场的不断增加,大量移动机器人出现在物流运输、商场服务、机场搬运等环境中,人类对移动机器人的定位、控制和追踪性能要求增加。在移动机器人的定位和运动中
当前,世界范围内研究较热门的两种半导体材料分别是SnO和Ag2S。其中,在常温常压下,SnO是一种蓝黑色金属结晶粉末,化学特性稳定,其直接带隙为2.7e V,间接带隙为0.7e V。因其电
近年来,科技水平的提高推动着生活方式的改变,基于位置的服务在生活中成为了非常重要的一部分。在室外环境下,卫星导航系统已经十分完善,但此系统并不适用于室内环境,因此,室
小鹅瘟是一种高发病率和高死亡率的传染病,给我国养鹅业造成了巨大危害。目前小鹅瘟病尚无有效的治疗药物,主要依靠卵黄抗体(Immunoglobulin of yolk,IgY)和高免血清等进行防治,所以新型药物的研制具有重要意义。干扰素(IFN)是体内一种重要的干扰病毒繁殖的免疫活性细胞因子,主要由病毒、噬菌体及人工合成核苷酸(如聚肌胞)诱生,具有广谱的抗病毒活性,对多种病毒如DNA病毒和RNA病毒均
近年来,现代社会科学技术的迅猛发展,导致传统电网向着新型智能电网过渡,使其具有信息物理系统的一系列新特性。然而,由于信息物理系统具有复杂性、开放性等特征,存在许多潜在的针对广域测量和数据采集的恶意信息攻击,严重影响了智能电网的安全运行,促使人们加大对智能电网安全性的关注。因此,针对智能电网信息层容易被恶意攻击的特点,考虑通过设计自适应Kalman滤波器,对智能电网系统可能遭受的恶意信息攻击进行检测
随着纳米科技的飞速发展,原子力显微镜(atomic force microscope,AFM)已经在各领域的科学研究得到了广泛的应用。相比传统的接触模式与轻敲模式AFM而言,非共振模式AFM能够实
杰拉尔德·维兹诺(1934-)是美国印第安裔作家中最多产、最具创新意识的代表。他在作品中书写养育自己的那片土地,为自己的同胞们发声。他富有责任心,笔尖总是直指印第安人所面临的最迫切的生存难题,但字里行间又带着他独有的幽默感。在1987年和2010年,他的小说《格里弗:一个美国猴王在中国》和《白土保留地之裹尸布》获得了美国国家图书奖。作为一名作家和大学教授,他为美国印第安文学创作及其研究做出了巨大贡