论文部分内容阅读
计算机的发展激起了人们对人工智能的渴望,互联网的飞速膨胀改变人们对信息的理解。人们希望计算机能和人类用语言交流,能读懂互联网上的信息,能帮助人们从海量的信息中准确地找到需要的信息。但是如何来做到这些呢?首先得让计算机“学会”人类的语言。这也就是人工智能的一个重要分支——自然语言理解所要研究的内容。然而,这是一项非常艰巨的任务。在巨大的困难和多次的失败面前,学者们开始将注意力集中在简单,但是实用、较小的任务上。语义角色标注便是其中很有代表性的一个方向。它是浅层语义分析的一种,对句子进行浅层次的分析和标注。其结果可以用于更深层次的语义分析,从而逐步实现自然语言理解的目标。语义角色标注在句法和语义之间架起了一座桥梁,是进行自然语言理解的基础性工作,具有很重要的意义。但是这座桥还需要句法研究的支持。其中一个很重要的内容就是句法依赖解析的研究。句法依赖解析和语义角色标注在经过多年的研究之后取得了不错的效果,但是仍有较大的提升空间。本文就是从另外一个角度,研究联合标注方法,使得不仅能够使用句法信息来帮助语义角色标注,也能使用语义信息来促进句法解析和标注,达到互相促进相辅相成的效果。本文主要工作和特色如下:1)设计并实现了一种基于概率评估模型的联合标注新方法。在生成多组较优的候选结果基础上,再从全局的角度对这些候选结果进行评估,选出一个全局较优的标注结果。从而克服了先句法后语义的传统流水线式标注方法中贪心策略的一些不足。2)修改传统的基于要素的语义角色标注方法中使用的特征,使之适用于基于依存表示的语义角色标注。3)设计并实现了一种基于迭代模型的联合标注方法。通过迭代,可以将语义标注的信息反馈给句法解析模块,甚至反馈给语义角色标注模块,从而修正标注结果,提升系统的整体标注效果。4)在基于迭代模型的联合标注系统中,针对句法和语义的相关标注,分别设计了用于迭代标注的特征来扩充原有的特征,以便利用迭代模型反馈回来的上一次迭代标注信息。