基于转换的依存句法分析研究

被引量 : 0次 | 上传用户:paltx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,依存句法分析越来越受到自然语言处理的研究人员的重视。相比于短语结构文法,依存文法具有表达简洁,可以直接面向语义,易于分析处理等优点,因而被广泛用于自然语言处理的各个研究和应用领域,如文本检索、自动文摘、自动问答系统、机器翻译等。作为当前依存句法分析的一类主要方法,基于转换的依存分析方法将依存句法分析作为一个状态转换的过程,通过执行一系列的动作,逐步建立起词与词之间的依赖关系,将输入句子(初始状态)转换至依存语法树(最终状态)。由于采用贪婪的搜索策略,相比较依存句法分析的另一类主要方法——基于图的方法,基于转换的依存句法分析尽管会牺牲少量的准确性,但一般有着更快的运行速度。本文首先简要介绍了依存文法的基本理论和前人提出的依存句法分析方法。然后在现有的一种基于转换的依存句法分析方法的基础上,依次提出了3种新的基于转换的依存句法分析方法:基于子树转换的方法,基于子树序列转换的方法,和两层的子树转换的方法。在前两种方法中,相邻的表示部分分析结果的依存树可以比较灵活地合并为一棵更大的依存树,而这两种方法的区别在于是用一连串分类器还是用一个序列标注器。在第三种方法中,我们尝试将依存分析分层处理,在第一层中建立每句分句内的依赖关系,在第二层中,利用前两种方法,合并分句的结果。基于转换的依赖分析器除了状态和动作的定义,关键就是使用分类器做动作预测,因而在介绍完转换模型之后,我们对所使用的分类器和特征选择策略加以介绍。最后我们通过实验证明本文提出的方法能够很好地完成中文依存句法分析的任务。在两个中文树库上,我们提出的方法都比原有的基于转换的依存分析方法有着显著的提高,尤其当在第二种方法中引入动作特征和在第三种方法中使用分层的策略,分析的准确率甚至超过基于图的方法。并且通过比较分类器,我们发现使用支持向量机能得到比使用最大熵模型更好的分析效果。
其他文献
志愿者是非营利组织中非常重要的人力资源,也是最具特色的人力资源。文章共分成五大部分,第一部分为绪论,在这部分中主要探讨了研究背景及意义、国内外研究现状综述、研究思
针对市场的要求,设计并优化了具有高分辨率的近红外一体摄像机镜头,即可见—近红外一体摄像机镜头。文中采用了宽光谱共焦成像的优化设计技术,利用ZEMAX软件设计了一款变倍比
报告46例角膜感染的临床病因,其中戴用角膜接触镜所致感染16例。接触镜组主要为真菌(50%)和绿脓杆菌(25%)感染所致,而非接触镜组则主要为病毒性感染(60%)。本文认为:接触镜戴用组因角膜相对缺氧可能
目的探讨葡萄糖酸锌治疗小儿轮状病毒腹泻的临床疗效及安全性。方法本研究按照随机数字表法将186例轮状病毒腹泻患儿随机分为研究组和对照组,其中,对照组患儿给予补液纠正脱
金融业处在现代经济体系的核心位置,金融业贷款风险管理的重要意义在于要切实保障金融业在健康稳健运营的前提下,不断向经济机体注入适量和适时的资金流,从而保障整个经济机
随着我国国民经济持续增长,国内居民财富日益膨胀,形成了对金融产品需求的迅速增长,产品类型也呈多样化发展态势。同时因国内银行监管国际化的要求,不断注重资本监管和风险监
随着国有企业改革的进一步推进、国际经济竞争的加剧,企业内部控制制度建设刻不容缓。近年来,国内外会计和财务理论界对于内部控制领域的研究学术成果层出不穷,并且建立了清
制作法律文书须引用法律条文。引用法律条文应正确,要做到准确、具体、有序、规范。
本文给出了井下地震仪软定向的原理及一般方法,并具体确定了菏泽台井下地震仪的方位;同时,文章对软定向的误差和精度进行了讨论。
从上个世纪九十年代后期开始,我国艺术类考生快速增长,多数高等艺术院校和师范院校艺术专业大幅度扩招、普通高校纷纷增设艺术类专业,形成“艺考热”(“艺术报考热”和“艺术