论文部分内容阅读
事件抽取(Event Extraction),指的是从非结构化的文本中,获得有价值的事件信息。随着数据处理量的日益增大,对事件信息进行自动抽取有着很重要的研究意义。传统的事件抽取方法,一般采用联结抽取型架构的模型,并结合大量的人工设计的特征,来进行事件抽取;或者采用两级分类器的级联型架构,其中特征表示要么仍然采用人工设计的特征,要么采用基于词向量的参数化表示。本文的研究内容和成果如下:1.提出了一种新的卷积神经网络模型,跳窗卷积神经网络(Skip-Window Convolutional Neural Networks),解决使用特征工程来进行特征学习时,通常存在的泛化性能问题和数据稀疏性问题,并且,传统的卷积神经网络只能提取句子级别的特征,而本文的模型能够提取出词级别的全局结构特征。首先,将特定词的词向量,与句子中其他所有词的词向量,连同其相对位置信息进行拼接整理;其次,将上一步的整理结果,当作卷积神经网络的输入,经过一次卷积和池化后,就可以得到特定词的全局结构化特征。2.提出了一种基于循环神经网络(RNNs)的结构化学习模型,可以使用神经网络提取的参数化特征进行结构化学习,解决了结构化学习中一般只能使用one-hot特征的局限。首先,将每个词的输出类别训练成标签向量;其次,利用RNNs对于变长序列建模的优势,对句子序列的整体标签组合进行打分,并利用集束搜索(Beam Search)的方式对句子序列的最终标签组合进行求解。3.设计了一种全新的事件抽取框架,能够有效的结合跳窗卷积神经网络和循环神经网络,采用联结型的方式进行事件抽取,能够同时对事件触发词和事件参数进行抽取,解决误差传播问题。本文采用了 ACE2005的公开语料集进行实验,以目前效果最好的几种事件抽取模型相比较,事件触发词识别指标上F1值超过目前最好的事件抽取系统1.3%,在其他指标上也达到了不错的效果。