基于事件链的语篇连贯研究

被引量 : 28次 | 上传用户:juhn7557
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语篇连贯无论在语言教学还是信息处理中都有着非常重要的作用。语篇连贯一直以来也是篇章语言学的研究热点之一。有关篇章连贯的理论也层出不穷,异彩纷呈。其中比较有代表性的理论有韩礼德和哈桑提出的衔接加语域理论,VanDijk的宏观结构理论,Mann和Thompson的修辞结构理论,Danes和Fries提出的主位推进理论,以及Grosz et al的中心理论。从计算机可操作性的角度审视这些理论,可以发现这些理论所揭示的篇章连贯的模型可以归结为三类:基于关系的表示模型,基于逻辑的表示模型和基于实体的表示模型。这些模型在计算可操作性方面存在一些问题:要么现有的计算机技术无法满足模型的实现,要么模型本身的语言学假设过于松弛。基于此,我们提出基于事件链的语篇连贯理论及模型,以增强基于实体的语篇连贯模型的语言学假设,同时利用现有较成熟的句子和事件分析技术,为语篇连贯的判定和应用提供一条新的途径。连贯的篇章中存在指向中心话题的事件,这些事件按照一定的关系相互关联构成事件链。事件链建立在词汇链的基础上,在一定程度上保证了其计算的可操作性。全文分为八章,主要内容和观点如下:第一章:研究引论。引论分为六个小节,具体内容包括语篇连贯研究背景、语篇连贯国内外研究现状及分析、语篇连贯研究存在的问题、本文研究内容和研究对象、研究方法、本文结构。第二章:语篇连贯理论。本章简要介绍语篇连贯的主导性理论以及分析这些理论的计算机可操作性。第三章:事件理论。本章主要从理论层面讨论事件和事件链用于分析和判断语篇连贯的可行性。事件在不同领域有不同的定义。我们采用哲学和语言学对事件的定义,即事件是动词表达的概念。事件按照其动词所具有的时间结构而产生了相应的事件结构。传统的事件研究只是局限在句法的基础上,没有上升到篇章的层面。在此基础上,我们认为动词的语义辐射不仅仅局限于句子内部,它可以超越名子层面而进入语段和语篇层面。这种超越句子而进入语段和语篇层面的事件结构分析我们称之为事件链,事件链的存在影响着语篇的连贯程度。同时,事件的良构性使得事件能够广泛应用于自然语言处理的各个领域,这为事件链用于分析篇章连贯提供了技术保障。篇章语义结构呈现一个层级结构:处于最上层的是宏观语义结构,第二层是篇章的微观语义结构,第三层是实体关系层,最底层是词汇语义层。宏观语义结构通过微观语义单元一事件和事件之间的关系来表示。事件和事件关系的体现是建立在实体关系和词汇语义的基础上。事件类型按照动词的功能分为六类:动作型事件、关系型事件、感知型事件、生理型事件、陈述型事件和存在型事件。每类事件的语义角色探讨,事件与句子之间的关系,事件关系类型。本文提出的事件关系类型包括十一种关系类型:并列、顺承、解说、选择、递进、转折、条件、假设、因果、目的、共指。第四章:事件链模型。本章主要从计算模型的角度讨论事件链模型如何构建篇章连贯。结合汉语篇章实例,提出事件和事件链的描写机制。对于事件的描写,我们采用通常的谓词论元结构;对于事件链的描写,则主要赴描写事件间的相互关系。第五章:事件链构建。篇章中事件链的构建从词汇链开始。构建词汇链后,根据临近原则,查找词汇链上的谓词及诩词携带的论元,形成篇章基本构成单元一事件。这些事件按照一定的关系构成事件链。具体包括以下内容:第一节探讨汉语篇章的词汇链构建。第二节探讨事件链构建,分为事件识别和事件关系识别。第三节讨论事件链计算方法。第四节讨论事件链评估策略。第五节总结本章内容。第六章:事件链资源建设。本章分为四个小节,主要讨论如何从事件和事件链的角度来构建语篇连贯资源。具体内容为,第一节阐述建靠语篇连贯资源的目的和意义,概述了目前存在的中英文语篇连贯相关资源的特点。其中,英文语篇连贯资源包括宾州语篇树库(Penn Discourse Treebank)、修辞结构树库(Rhetorical Structure Treebank)、语篇连贯图库(Discourse GraphBank),中文语篇连贯资源包括中文命题库(Chinese PropBank),中文语篇树库(Chinese Discourse Treebank),汉语财经评论的修辞结构标注语料库等。这些资源建设选取篇章连贯的角度不同,其标注方法也各有千秋,为后续基于事件和事件链的汉语语篇连贯资源建设奠定了基础。第二节阐述如何从事件和事件链的角度构建汉语语篇连贯资源,具体内容包括语料的选择、标注标准的确定、标注质量控制、标注效率和标注平台的搭建。我们选取宾州中文树库的新闻语料作为标注的对象,制定了详细的词汇链、事件、事件链和事件关系标注标准,并根据事件和事件链标注的特点搭建起标注平台。第三节标注前期成果展示。第四节就构建基于事件和事件链的汉语篇章连贯资源过程中出现的问题进行讨论。第五节归纳总结基于事件链的汉语篇章连贯资源建设并提出展望。第七章:事件链应用。本章主要就事件链的应用展开讨论。事件链可以应用在对外汉语教学和语言信息处理两个方面。具体到章节的分配上,第一节选取汉语教学中的写作环节来讨论事件链的应用;第二节选取自然语言处理中的自动摘要生成来讨论事件链的应用;第三节总结事件链的应用及其意义。第八章:结论。本文主要创新点在于以下四个方面:第一,从理论研究层面来看,把语篇连贯这个传统语言学中的复杂问题形式化为一个可计算的分析问题,并将之用在作文评判和句子排序中。第二,从表示机制来看,提出基于事件链的表示模型,将事件链作为语篇连贯的必要条件,既一定程度模拟语篇的语义内容,又可确保可计算性。第三,从分析模型看,基于事件链的分析模型为大规模处理汉语篇章级深层理解和信息奠定计算基础。第四,从资源建造来看,建设大规模的事件链标注资源,可用于训练和测试,也可用于更一般的篇章语义分析任务。
其他文献
在收集水文地质资料基础上,开展了详细的现场勘察、现场试验和水文地质条件分析,掌握了评价区环境水文地质条件。地下水环境影响预测采用水流模块耦合模块对评价去进行模拟,
鉴于离子阻挡膜保证了三代像增强器的工作寿命,但增加了微通道板和三代像增强器的噪声因子,降低了三代像增强器的信噪比,削弱了NEA光阴极的优势,提出一种最新研制的微通道板
目前发现,海洋微藻有增强人体免疫力和心血管保健的功能,对多种疾病有预防和治疗作用[1~5]。本文通过海藻生物制剂抗病毒实验研究,观察其抑制呼吸道合胞病毒的药效作用。1材
目的观察ICU重症心力衰竭患者应用有创机械通气治疗的临床效果。方法选取医院ICU接受治疗的患者86例临床资料进行分析,将接受常规治疗的患者纳入对照组(42例),全部患者均接受
心房颤动(AF)是常见的心律失常,也多见于冠心病患者。AF的治疗目标是转复并维持窦性心律、控制心室率和预防血栓栓塞。但对于冠心病合并AF的治疗,是注重于冠心病本身的治疗,还是主
提出了一种变温条件下红外光学材料透过率测量评价方法。研究内容包括使用准直反射镜将红外光源变为平行光,通过斩波器变为脉冲光,再经滤光片选择波长;使用平面反射镜组与精
唯美主义,是十九世纪中期开始以法国为中心而波及欧洲的一种文艺思潮。唯美主义认为艺术应当追求单纯的美感,认为“美”才是艺术的本质,主张“为艺术而艺术”。作为文学史上与西
摘要:近几年随着国家对三农扶持政策的不断推出,农村经济遇到千载难逢的发展良机,发展速度突飞猛进。农村公路对农村经济发展的重要性不言而喻,它是农村经济发展的重要基石,只有农
2010年是我省实施新课改后参加高考的第四个年头。高考已结束,今年高考试题难易如何?命题方向有没有变化?我刊特邀一批有着丰富的高三教学实践经验的教师,或一直关注高考命题
<正>随着《关于基础教育改革与发展的决定》和《基础教育课程改革纲要(试行)》的相继颁布,我国新一轮的基础教育课程改革拉开帷幕。本次基础教育课程改革的目标是改变传统教