面向层次化的汉语功能成分识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:alanyu97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析一直是自然语言处理任务中的重要课题,它的主要目标是根据语言学知识制定的语法规则或者基于统计知识建立的模型,自动建立由基本句子单元之间的基本关系构成的一棵多层树,目前其主要研究面向两种句法树:短语结构树和依存句法树,两者均可以产出在各自语法和规则的条件下的句法结构。但是在这两种分析方法提出之后,并没有对原有的句子单元中的一些其他成分进行进一步处理,依然还是在原来的定义基础上进行研究,例如对句子功能成分等并没有进行足够的分析,而这些功能成分在很多自然语言处理任务中都有很大的应用,例如在机器翻译中,我们可以将功能成分信息加入到词对齐任务中,在依存句法分析中,可以在分析过程中用功能信息来进行约束。在这种需求的驱动下,本文提出了汉语层次功能成分树的研究。目前,面向汉语功能成分的研究并不是很多,而层次化的汉语功能成分研究更是比较少,在这种背景下,我们提出了层次化的汉语功能成分语料—汉语功能树库的建立方法,同时提出了在该语料上不同层级的分析方法。本文的具体研究内容及研究成果如下:(1)层次化汉语功能树建立的过程中,我们首先借鉴前人类似的工作,提出了一种基于规则从宾州树库语料中提取并建立多层汉语功能成分树的方法,接下来我们从该功能树上提取不同层级的数据,提取后得到的语料将会用在后续的分析任务中。(2)在层次化功能成分分析任务中,我们提出了一种分步的分析方法,分别从从句级别,基本功能层级和功能名词短语结构层级三个部分依次进行分析,并将不同层级的结果作为新的特征加入到其他层级的分析过程中,在从实验的结果上看,这种分析方法对各个单独阶段的模型都有一定的效果提升。从本项目中的研究中,我们发现层次化的汉语功能成分识别具有很好的研究前景,在本文中,我们提出了一种可行的分析方法来实现这一目标,从实验结果上看,该研究具有很好的研究价值。
其他文献
蚁群算法是意大利学者M.Do rigo,V.Maniezzo和A.Colorni通过模拟蚁群觅食行为而提出的一种基于种群的模拟进化算法。作为一种全局搜索的方法,蚁群算法具有正反馈性、并行性、
目标跟踪技术是计算机视觉领域研究的重要课题,它融合了图像处理、模式识别、机器学习、优化理论和偏微分方程等相关领域的先进技术和研究成果,在视频监视系统、机器人导航、军
据交通部门统计,近年来,我国道路交通事故一直高居不下。不仅带来巨大的经济损失,而且给人民带来精神上的伤害,死亡人数也是世界上最多的国家。引起交通事故发生的原因很多,
许多交通事故,源于司乘人员的疲劳驾驶。对人眼疲劳监控,能减少车毁人亡事故,减轻当事人的巨大痛苦,减少社会经济损失。人眼边缘提取、人眼状态判断和人眼疲劳识别等技术,是
在信息时代各种数据每日激增,数据的价值更是不断的飙升。有效存放这些海量数据是对目前的存储系统的巨大挑战。针对海量数据安全存储这一目标,存储系统必须采取有效的技术措
声学事件是指在既定的环境下,人类能够区分和理解的具有完整含义的一段连续的声音信号。声学事件检测是指在声音信号中依据声音信号的声学特性检测是否包含特定声学事件的过
学位
现在社会每年都产生巨大的信息量,由此产生了巨大的存储空间需求,使得存储设备消耗越来越多的能量。磁盘阵列以其良好的性能和可靠性在存储设备中占据了重要的位置。然而,磁
随着互联网的飞速发展,流媒体服务已成为网络服务中最普及的应用之一。在提升流媒体服务性能及稳定性的同时,流媒体服务的安全性也受到了越来越多的关注。本文以流媒体服务是
随着科学技术的飞速发展,人类在认识世界、改造世界的科技活动中不断积累着丰富的科学数据。科学数据的急剧膨胀,信息量的极大丰富,导致用户无法从海量数据中准确及时地获取