基于分块的汉语句法分析技术设计与应用

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:xiaokun787
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析作为自然语言处理核心的技术之一,是许多自然语言处理任务的基础。对于一些需要利用深层句子结构信息的语言处理任务而言尤其重要。因此,句法分析技术得到了广泛的研究。但是,由于句法分析的固有难度,与其他自然语言处理基础技术相比,其水平目前仍相对较低,尤其是对于汉语这种句法结构相对自由的语言,还有许多问题需要进一步深入研究。本文针对汉语语言,在综合分析当前若干句法分析模型特点的基础上,开展了如下的工作。设计并实现了一种基于分块的汉语句法分析技术。该技术将整句句法分析分为三个阶段:首先将句子进行分块,然后分别在各块中进行块句法分析,最后将各块分析得到的句法树合并得到整句句法分析结果。在分块阶段,通过将分块任务转化成序列标注任务,实现了一个基于条件随机场模型的分块算法。在块句法分析阶段,为了降低问题复杂度,进一步将其分解为块结构分析和标签分类两个子阶段。其中,将块结构分析转化为序列标注问题,实现了一个基于条件随机场模型的块结构分析算法,并引入集束搜索技术来缓解错误累加问题;综合利用多种特征实现了基于条件随机场模型的标签分类子算法。实验结果表明了本文所提出的汉语句法分析技术的有效性。最后,将所提出的句法分析技术应用于信息检索任务中,实现了一个面向旅游领域的信息检索系统,实验表明,加入句法分析技术有效提升了信息检索系统的性能。
其他文献
目前,搭载Android平台的智能手机成为人们日常生活中不可或缺的一部分,其在医疗行业的应用也在不断深入。我国的医疗资源仍然极为有限,医疗资源的分配相当不均匀,与此同时,仍
随着互联网的飞速发展和软件开发的多样化,软件复杂性和需求量急剧增长。然而,伴随产生的软件质量与安全问题也日渐突出。近些年来,由于软件错误导致的严重事故屡见不鲜,例如
根据相关统计,人类获取外部世界信息的方式主要是通过视觉来完成的,这一比例大约有80%。这足可以说明视觉对于人们获取信息是非常重要的。然而一些危险的生产环境以及人类视
随着移动多媒体业务的快速发展,大数据的高速传输对现有的无线通信网络提出了严峻挑战。通过在小区中部署3维天线,将3D MIMO天线技术引入到无线中继(Relay)网络,结合3DMIMO和
近年来,随着通信技术的发展,定位技术得到了很大的发展,定位业务作为移动通信和个人通信不可或缺的一部分,为用户的生活提供了很大的便利。定位业务是通过全球卫星导航系统、
近几年来,伴随着移动通信技术的高速发展,移动互联网也呈现出一片繁荣景象,各种通信方式不断推陈出新,人们对通信的速度、带宽和质量等提出了更高的要求。这将使自然界中原本
随着高等教育大众化进程的不断推进,地方大学迅速崛起,成为高等教育的主力军。但是近年来地方大学快速发展的同时也存在很多问题,以同质化问题最为突出。因此走特色发展之路
智能终端和4G网络的发展揭开了移动互联网的新时代,移动应用开发市场前景广阔。当下移动应用繁多,更新换代频繁,只有品质过硬、开发迅速并且有创新功能点的移动应用才能获得
多种接入技术互相融合是移动通信发展的必然趋势,用户可以通过多模终端(Multimode terminal)方便、快捷和无缝接入异构网络,从而获得多元化、个性化的高质量服务。然而,当终
随着信息时代的到来,海量数据处理成为越来越多行业面临的挑战。云计算以庞大的集群作支撑,为用户提供类似超级计算机的计算能力,成为处理海量数据的关键手段。Hadoop以其高