论文部分内容阅读
学者们对于回指研究的热情已经历经半个世纪而不衰,研究方法也涉及各种语言学理论的方方面面。指代消解研究起源于自然语言处理,其主要目的是使用计算机来为篇章中的回指语找到正确的指代对象。因其从计算语言学的角度着手,着重研究回指的生成和理解乃至篇章的理解,近年来成为回指研究的新方向,引起了不少学者的关注,但这方面的对比研究几乎还为空白,有待填补。指代消解研究所采用的理论框架是多种多样的,向心理论是其中的一种。在向心理论的基础上进行指代消解开创了指代消解的一个新局面,因为向心理论恰到好处地把语言学理论框架和计算机系统要求的可操作性结合在一起。向心理论描述了话语的注意焦点、指称方式的选择和语篇连贯性之间的关系,利用“中心”概念对语篇的连贯性和显著性进行解释,并为读者(听者)识别代词或名词词组的指称对象提供了三条制约条件和两条规则。其中制约条件三和规则一为语篇中的回指语提供了一个理想的消解模式。向心理论是二十世纪八十年代初由计算语言学领域的学者提出的,之后被广泛的应用于各种语言的指代消解和篇章处理中。本文选择该理论作为研究基础一是因为它在指代消解方面体现出的有效性,二是因为以向心理论为基础的对比框架不同于以往的一般英汉回指对比研究,即向心理论的参数对比研究。这些参数包括“规则一代词”、“语句”和“前瞻中心的排序”。本论文主要研究了以上三个参数在英汉语中的最优设定和组合,分别检验了每个参数在指代消解中的表现,并按照其影响消解的强弱程度排序,最后比较两种语言的不同结果。该研究为实证研究,充分运用了计算语言学的方法,人工标注三万字从而建成了小型语料库,而且为了计算的准确性,所有的消解由计算程序自动实现。结果表明,这三个参数对于英汉指代消解的影响程度是不同的。对中文影响最大的是代词,经证明,零形代词是中文中最典型的规则一代词,其使用非常符合向心理论的预测;其次是语句,以述谓结构来定义语句取得了较好的结果;最后是前瞻中心的排序,虽然它位居第三,但它对指代消解的意义重大,零形主题的识别显著的提高了消解结果。对英文影响最大的也是代词,第三人称代词是英文中主要的规则一代词,但其使用并不完全符合向心理论的预测,而且在不同位置的第三人称代词对指代消解的影响是不同的:在主语位置的代词比在其他位置的代词更符合向心理论的预测;其次是语句,以时态小句为单位定义语句取得了较好的效果,而且英文中主句与从句的区分对消解有明显的影响;前瞻中心的排序对指代消解的影响最小。