论文部分内容阅读
在拥有浩如烟海般信息的时代,如何从大量碎片化的文本数据中获取人们需要的有价值的信息成为一个巨大的挑战。事件抽取技术能够有效地挖掘与提炼文本信息,以便让用户快速准确地得到所需,因此逐渐成为自然语言处理领域的研究热点。然而,文本数据存在维度高、歧义多的特点,传统的方法将事件抽取划分为触发词识别与事件元素分类两个任务,在这个过程中需要人工分析并选择大量的特征,过于依赖自然语言处理工具导致模型无法大规模应用,存在错误级联传播、特征工程繁杂的问题。因此,本文针对错误级联传播与繁杂的人工特征工程问题,以模式识别、深度学习为研究基础,从迁移学习的角度出发,结合当前事件抽取的研究趋势,分别对嵌入特征的高效表示、多个嵌入特征的有效联合两个方面进行研究,通过表示和集成词嵌入、触发词嵌入、距离嵌入等低维稠密的向量特征,深度挖掘文本内隐藏的高层次信息,最终提升事件抽取模型的性能。为此,本文研究工作及创新点主要包含以下内容。针对繁杂的特征工程问题,分析事件抽取任务分阶段完成的原因,论文提出了一种基于多神经网络融合的触发词识别模型。为获取触发词的嵌入特征表示,论文将触发词识别建模为序列标注问题,基于双向长短时记忆网络和前向神经网络的融合模型完成任务,其中引入了词嵌入表示、实体类型嵌入、依存关系嵌入以及词性嵌入四类局部特征,并结合全局上下文的语义信息。实验表明,本文提出的方法结合局部与全局信息,可以有效提升事件触发词的识别效果。针对误差级联传播问题,研究了嵌入特征的正则化迁移方法,论文提出了一种基于联合嵌入特征的事件抽取模型。通过迁移触发词嵌入表示并联合位置特征与词嵌入,借助联合嵌入特征的丰富信息,深度挖掘潜藏在事件元素与事件触发词之间的内部联系。同时为了能够达到多事件抽取的效果,将触发词与事件描述一一对应,通过将事件元素语义角色分类任务建模为(触发词,事件元素)的关系分类问题,能够有效改善该问题。实验证明,本文提出的模型能够有效地迁移已有的触发词信息并提升事件抽取的效果。最后,论文在ACE、CEC数据集两个典型的事件抽取数据集上,对本文所提出的方法进行评测,并与同类的流行方法进行对比分析证明了本文提出方法的有效性。更深入地,本文对比模型中各类嵌入特征的特性及收益,表明了联合嵌入特征方法的优越性。