【摘 要】
:
在自然语言的处理中,存在着各种不同定义的树层次结构,比如短语树,依存分析树,音律层次树等等。这些不同的树结构由不同的文法定义产生。在自然语言处理中存在着很多不同定义
论文部分内容阅读
在自然语言的处理中,存在着各种不同定义的树层次结构,比如短语树,依存分析树,音律层次树等等。这些不同的树结构由不同的文法定义产生。在自然语言处理中存在着很多不同定义的文法,比如短语结构文法(PSG)[1],词汇功能语法(LFG)[2,3],树-邻接文法(TAG)[4],组合范畴文法(CCG)[5]等等。由不同的文法标注产生了自然语言处理中语料库,其中应用最广泛的有组合范畴文法语料库(CCGBank)[6],以及宾州短语树库(Penn Treebank)[7]等。在不同语料上进而开发出了不同的分析器。那么如何比较各种基于不同语料的分析器性能是研究领域比较关心的一个问题。这种跨语料的比较往往基于句法树之间的转换。另外,不同定义树结构之间的映射关系也可以创造性的解决某些问题,比如本文中的语音停顿分析任务。因此,本文旨在研究不同定义框架下树结构的转换,并且分为两个部分:语言学驱动的句法树之间的转换,这部分实现了组合范畴文法分析树到短语树的转换,并与前人的工作进行了比较,达到了更优的性能。二,应用驱动的句法树之间的转换,这一部分实现了短语树到音律层次树结构之间的转换,从一个新的角度解决语音停顿分析任务。实验验证具备使用价值。
其他文献
后现代视阈中的高等教育学科是一个开放的发展领域,其开放发展通过问题的开放和研究的开放得以实现,根本在于人的开放。中国高等教育学的发展应在坚持问题研究和多范式实践的
论文主要研究了石化行业中裂解及后续加工过程的优化问题,并通过开发软件实现决策过程工具化,决策工具智能化。石油化学工业是我国国民经济持续稳定发展的重要支柱型基础产业。
讨论式教学法是在教师指导下,在教师引发学生思考问题的基础上,调动学生的学习积极性,让学生自觉主动地参与教学过程,从而加强师生之间、生生之间相互交流的一种典型的互动教
从女性视角入手,以《喧嚣与骚动》、《八月之光》、《押沙龙,押沙龙!》、《老人》等作品为研究文本,结合福克纳的思想,探讨福克纳笔下那些没在清教主义、父权制、妇道观和种
从消防站的固定费用、正常费用、行驶距离和通行时间等多个优选指标综合考虑,建立了基于熵权TOPSIS法的城市消防站选址模型。采用主客观相结合的熵权法来确定指标的权重系数,
目的比较静脉留置针和传统头皮针用于儿科输液的效果,并探索静脉留置针的合理穿刺部位。方法将964例患儿随机分为试验组和对照组,试验组采用静脉留置针输液,对照组采用传统头
学位是学术的体现,与高等教育及其管理有着密切联系。学位实际上是个体通过教育这一实践活动追求学术和社会通过管理活动评价学术而产生的,是在与“个体”、“教育”、“学术
纵览现代汉语汉语中缀问题的研究状况,从意义虚化、黏着、定位、语音弱化四方面尝试给出中缀的界定标准。并以汉语事实为根本、现代汉语词典为主要语料库,就学者们争议最大的
本文以哈尔滨中庆燃气公司股权转让案例为研究对象,从管理学的视角全面的阐述了哈中庆燃气股权转让全过程,通过对我国国有股权转让现状的分析,结合哈中庆燃气项目的特点,发掘出转
随着中国加入WTO和经济全球化的浪潮,我国企业将面临着激烈的竞争。要想在这激烈的环境中谋求发展,就必须打造自身的核心竞争力。人力资源是企业的最重要的资源,是企业获取竞争