基于依存句法分析的语义角色标注

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sharongd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机处理能力的提高以及统计机器学习等理论的发展,浅层语义分析逐渐被研究人员所重视。语义角色标注是浅层语义分析的一种实现方式,其具有问题定义清晰,便于人工标注和评测等优点,同时又具有非常广泛的应用前景。对语言的深层处理过程中,句法分析处于一个十分重要的位置,也是浅层语义分析最直接的基础。在句法体系中,依存句法以其形式简洁、易于标注、便于应用等优点,逐渐受到研究人员的重视。在句子分词结果的基础上,依存句法分析不引入新的短语节点,句法结构信息附加在词和词之间的关系上,句法分析结果得到相对的简化;其分析结果趋向扁平化,句法树层次较浅,这使得句法树上的节点之间距离相对缩短,简化系统的同时也更利于研究节点之间的关系;句子中原本线性距离很远的节点有可能存在很近的甚至是直接的依存关系,这有利于在意义层面对句子结构的理解。本文实现了一个基于依存句法分析的语义角色标注系统,它将语义角色标注任务分为谓词识别、谓词分类、语义角色识别和分类、标注结果生成等四个部分。这个系统参加了CoNLL2008国际评测,其F-Score达到78.52,最终取得了第二名的好成绩。传统的语义角色标注结果生成阶段只利用或主要利用了角色本身和角色与谓词之间的上下文信息,而没有挖掘同一谓词的多个不同角色之间的相互作用,即谓词框架的全局信息。本文在参加CoNLL2008评测的系统的基础上,利用柱状搜索算法生成若干较好的候选标注结果,再使用Online Passive-Aggressive算法训练一个用对数线性模型对候选结果进行重排序。最终又取得了0.2%的性能提高。
其他文献
数据库是信息系统的核心,集中存放着大量重要而又敏感的数据,是最吸引攻击者的目标,一旦数据被黑客窃取或者是破坏,其损失难以估量。传统的数据隔离技术不能有效地防护黑客的
随着计算机和网络的飞速发展,我们已经进入了数据信息爆炸式增长的时代,如何从海量的非结构化信息中提取真正满足用户需求的信息,已经成为一个越来越重要的研究课题。自然语
跟踪视频中的运动目标是计算机视觉领域中富有挑战性的课题之一,在视觉导航、安全监控等领域有着广阔的应用前景。开发鲁棒的跟踪算法也具有重要的理论意义。文献中广泛使用的
随着微博服务平台的快速发展,使用微博的用户数也越来越多。人们基于此传播和获取与热点事件相关的信息,这些微博的内容高度相似,信息质量参差不齐,亟需相关技术将其梳理。给
近年来,随着定位技术与无线通信技术的迅速发展,对移动对象进行跟踪与定位变得可行与必要。目前分布式时空数据的查询解决方案是将分散在世界各地的数据服务器都接入到互联网中
目前越来越多的企业采用基于WEB模式的系统作为企业信息发布、交换、管理、交易的平台。但随着电子商务的发展,B/S结构的WEB系统在用户界面与服务器交互方面的不足逐渐体现了
软件测试作为软件工程的一个重要组成部分,备受研究学者的关注。然而软件测试的花费是极其庞大的,至少50%的软件开发成本用于软件测试,回归测试作为软件测试的一个重要环节,
在网络研究领域,模拟技术已经成为在各种条件下研究网络运行状况和性能的重要方法。但是复杂的大规模网络模拟会消耗大量的计算机资源,甚至规模过大的模拟任务根本无法在一台
近几年里,软件外包已经成为世界软件产业发展的一个重要趋势。越来越多的企业寻求外包软件开发商,当面对越来越多的市场外包软件开发商需求时,对软件外包服务的质量评价的需求也
近年来,随着微博的快速发展,微博数据成倍增长,如何利用这些海量的数据,挖掘有用的信息,成为了研究热点。其中,微博情感分类是一个比较热门的研究方向,它在分析与预测时事走