基于解析序列的高阶非投影依存分析器

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sarnimoon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前计算机科学中的自然语言处理相关研究迅速发展,而寻求更好的句法解析则是众多自然语言处理系统中关键的一环。其中,依存分析句法凭借相对短语结构句法更直观简洁的表达形式和词序无关的优点,在近年逐渐成为研究的焦点。本文就依存分析方法展开研究,分析基于图和基于转移的两种主流依存分析方法,针对现有依存分析器对非投影语言的支持不足,通过模拟人在处理自然语言时的分析过程,提出一种全新的依存分析器框架,来更好地利用高阶特征和支持自由语序。在每一步的解析当中,首先确定当前最容易解析的从属词,然后选出最优核心词并构成依存边,加入解析结果中,逐步生成一棵解析树。本文构建的系统框架由两部分组成:解析序列生成器和核心词匹配器,两个部件之间通过解析序列协同工作。其中解析序列生成器确定一个解析的顺序,使得解析遵循简单优先的原则;核心词匹配器以线性打分器为依据,按照解析序列为每个当前处理词选择最佳核心词。本文中贪心的解析策略在华尔街日报测试语料中获得了较好的结果,端到端解析精确度达到89.50%,并在5个非投影语言当中测试非投影边的解析精确度中,展示了较基于图和基于转移的依存分析器更优的结果。此外,本框架还能灵活地支持纳入现有的解析优化技术,系统的两大部件之间具体实现相对独立,可以分别优化和组合。
其他文献
近年来,基于位置的社交网络(LBSN)得到迅速地发展,如Foursquare,Whrrl,Facebook Places。因为兴趣点(POI)推荐可以帮助用户探索新的地方以及协助第三方业务提供个性化的服务,
随着计算机与网络技术的普及,当今社会的信息量随指数形势增长,我们进入了信息爆炸的时代,每时每刻都有海量的数据产生,比如城市交通数据、商品价格数据、人们的消费数据,上
关联成像,又称为鬼成像,因其新颖的物理特性,近年来成为光学成像领域的研究热点。关联成像是一种利用两路相关光进行成像的新型成像机制,其中一路光直接照射物体后经桶探测器
推荐系统作为个性化信息服务和决策支持领域的关键分支,由于其广泛的应用场景和极大的商业价值,近年来一直是学术界和工业界的研究热点之一。推荐系统的关键是推荐算法。其中
草图是产品设计的雏形,设计者绘制草图时无需关注过多的细节,同时也不需要掌握像CAD中繁杂的工具使用技能,只需要纸和笔就能够快速、流畅的完成设计稿。如果要将这种原生设计图转变成可以在计算机中表示并且能进一步编辑修改的矢量图,就需要对草图做简化处理并进行适当的矢量化。目前这部分转化工作有时需要靠人工完成,即将草图导入某些编辑软件中,人工描边完成简化和矢量化,这项工作费时又费力,为了改进这种工作方式,于
党的十九大报告关于民生发展方向的建议中指出要全方位多层次地推进医养结合,在整个国家范围内构建孝亲敬长的氛围和制度完善的服务体系,更符合现代社会老年人对理想晚年生活的向往。黑龙江省作为人口大省,在近年来年轻人口长期外流与老龄化压力增加形成鲜明的对比,尤其是收入低生活困难老年人的家庭本就缺乏劳动力。从社区、养老机构和医院三个着力点出发,其宗旨是实现医、养的的功能互补、相辅相成。全国各地积极响应应对老龄
学位
随着计算机网络技术的快速发展,互联网在生活着得到了普遍的应用。社区问答系统也随着Web2.0时代的到来,吸引大量的用户,积累了大量的信息,逐渐成为最流行的社交网络应用之一
无线手持移动设备如手机、平板电脑、可穿戴设备等往往集成了大量的传感器,并且拥有更高的存储能力,更快的处理速度以及更大的网络带宽。近年来,手持移动设备和群智感知思想
目的:本研究通过流行病学研究方法,调查年轻育龄女性月经、中医体质的分布情况,探讨地理气候、情绪、饮食偏嗜、睡眠、运动等因素对月经、中医体质的影响,从而分析月经病、偏颇体质的发生原因,为减少和预防月经疾病的发生提供理论依据。方法:制定一般资料调查表、月经情况调查表、生活习惯调查表和中医体质分类与判定表,对天津中医药大学在读女大学生进行现场问卷调查。分析上大学前后女大学生月经情况、中医体质类型并加以分
近年来,光敏有机场效应管(PhOFET)得到了广泛深入的研究。然而,研究报道主要集中在如何提高器件的光敏特性,针对宽光谱响应范围的研究却不是很多。本论文提出了制备宽光谱响应P