基于结构化学习的事件抽取研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:jmxhyundai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取(Event Extraction),指的是从非结构化的文本中,获得有价值的事件信息。随着数据处理量的日益增大,对事件信息进行自动抽取有着很重要的研究意义。传统的事件抽取方法,一般采用联结抽取型架构的模型,并结合大量的人工设计的特征,来进行事件抽取;或者采用两级分类器的级联型架构,其中特征表示要么仍然采用人工设计的特征,要么采用基于词向量的参数化表示。本文的研究内容和成果如下:1.提出了一种新的卷积神经网络模型,跳窗卷积神经网络(Skip-Window Convolutional Neural Networks),解决使用特征工程来进行特征学习时,通常存在的泛化性能问题和数据稀疏性问题,并且,传统的卷积神经网络只能提取句子级别的特征,而本文的模型能够提取出词级别的全局结构特征。首先,将特定词的词向量,与句子中其他所有词的词向量,连同其相对位置信息进行拼接整理;其次,将上一步的整理结果,当作卷积神经网络的输入,经过一次卷积和池化后,就可以得到特定词的全局结构化特征。2.提出了一种基于循环神经网络(RNNs)的结构化学习模型,可以使用神经网络提取的参数化特征进行结构化学习,解决了结构化学习中一般只能使用one-hot特征的局限。首先,将每个词的输出类别训练成标签向量;其次,利用RNNs对于变长序列建模的优势,对句子序列的整体标签组合进行打分,并利用集束搜索(Beam Search)的方式对句子序列的最终标签组合进行求解。3.设计了一种全新的事件抽取框架,能够有效的结合跳窗卷积神经网络和循环神经网络,采用联结型的方式进行事件抽取,能够同时对事件触发词和事件参数进行抽取,解决误差传播问题。本文采用了 ACE2005的公开语料集进行实验,以目前效果最好的几种事件抽取模型相比较,事件触发词识别指标上F1值超过目前最好的事件抽取系统1.3%,在其他指标上也达到了不错的效果。
其他文献
预算是不是监管的护栏?问题是放在企业的哪边,是否会置于路的中间?在瞬息万变的国际国内市场环境中,一旦企业经营活动中任何一个环节发生变动,都会导致全面预算的变动,犹如车行驶在
报纸
2019年10月11日,由中国造纸学会、中国制浆造纸研究院有限公司、加拿大林产品创新研究院(FPInnovations)共同主办的2019国际造纸技术报告会在上海世博馆成功举办。本届国际造
随着生活水平提高,人们越来越注重精神追求,文化创意产业也日益蓬勃。文创产品一方面是文化与自然的载体,突显历史文化特色,展现自然风光;另一方面产品具有展示、使用、收藏
《中国》杂志是丁玲在1985年发起创刊的文学刊物,虽然只短暂地存在了两年时间,但成功地推出了一批当代著名作家,为当代文学留下了许多优秀作品。其停刊是1980年代文学史上的
目的:探讨护理干预在荨麻疹患者护理中的临床疗效。方法将120例荨麻疹患者平均分成两组,实验组与对照组,各60例。对照组患者给予常规护理,实验组患者实施护理干预,比较两组患者的
目的探讨新兵述情障碍和心理健康的关系。方法采用多伦多述情障碍量表和症状自评量表对240名新兵进行测查,并进行多伦多述情障碍量表总分及因子分和症状自评量表总分及因子分
宿迁市将'落叶景观'作为城市的一张名片进行旅游、文化推广,营造落叶碧草、融合优美的城市自然生态环境。本文重点阐述了宿迁市落叶景观打造的主要措施及特色做法,为
15 好的燃烧器就一定有好的结果吗燃烧器对熟料煅烧的重要作用是不言而喻的,但由于每条窑的情况不同,而且就同一条窑来讲,原燃材料和工艺状况也在不断地变化着,所以,其使用的
我国现有研究生培养具有明显的学科交叉特性,根据学术型和专业型研究生不同的培养目标,提出了基于团队导师的研究生培养模式,探讨了基于团队导师的研究生培养模式的内涵和主
根据我国公共建筑能耗监测特别是电耗监测的现状,搭建公共建筑室内环境(温度、湿度、光照度)实时监测系统,为建筑能耗(空调用电,照明用电)提供能效比。本文对该系统的组成和功能