汉语动词论元约束优选信息的获取

来源 :华北电力大学(北京) 华北电力大学 | 被引量 : 0次 | 上传用户:manstation
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动词对论元的语义选择限制一直是自然语言处理研究领域的一个备受关注的问题。以往的研究者对动词语义约束优选问题的研究主要在句子级别进行,考虑的都是动词作为句子的中心谓词情况下,动词对其相关论元的语义类约束问题,而对于动词在复合结构中出现时的语义优选问题没有深入研究。本文主要研究汉语复合结构中的语义优选问题。NV复合结构是汉语中常见的以修饰语为名词,而中心语为动词名物化的长度为2的复合结构。本文将NV复合结构中的语义优选问题刻画为一个分类问题。提出了两个语义优选分类模型:一个是基于自动词汇模板的分类模型;另一个是基于属性词相似度的分类模型。本文的创新性主要在于以下方面:一、文中提出了将自动获取的词汇模板直接作为分类器的分类特征,同时利用正例和反例的词汇模板来对语义关系进行标注。并在最后将自动词汇模板与手工词汇模板模型,基准模型等模型的效果做了比较,证明自动词汇模板模型的效果相对于这些其他的模型具有的优越性。二、提出基于属性词计算词汇间的语义相似度,并将其用于语义优选分类。属性词用于描述概念定义的各个方面。如果两个概念所拥有的共同属性越多,则这两个概念的可能相似度就越高。通过将Miller-Charles词对的汉语翻译版本作为一个基准,与从HowNet计算得到的结果以及并列词模板模型等参照模型所得到的结果相比,基于属性词词汇相似度的模型取得了较好的结果。
其他文献
软件工程是一项复杂的活动,软件工程师分析理解具有众多不同内部关系的组件的复杂结构,并通过有效工具获取与软件结构相关的信息,这是软件工程中研究的一个热点。在面向对象
如今很多现有的数据并不存在于数据库管理系统,它们的数据结构很多是不关联的,有时也是不规则的,例如为HTML或SGML文档,尤其是XML文件,已经逐渐发展成为一个大型的XML数据储
随着电信业的快速发展,我国移动交换网络的网络规模越来越大,网络结构越来越复杂。用户人数不断增加,由此带来的日常管理的工作量也在不断增加,各通信运营企业为了不断提高企
随着互联网络的迅速发展和普及,为了追求网络上空闲资源的有效利用,一些著名的分布式计算项目陆续出现在了我们眼前。它们通常是把一个非常庞大繁重的计算问题分解成许许多多小
无线局域网WLAN(Wireless LAN)是计算机网络和无线通信技术相结合的产物,它使用无线信道提供网络接入,不仅被广泛应用于通信领域,还成为数据传输的有效手段之一,继而成为存储
自1985年Koblitz和Miller分别独立提出椭圆曲线密码体制(Elliptic Curve Cryptology, ECC)后,由于ECC本身计算速度快,存储空间小,带宽要求低,特别适用于Smart卡和无线应用环
人脸检测与识别技术是模式识别、计算机视觉领域内最有理论价值和应用前景,且极具挑战性的研究课题之一。其目的是使计算机像人一样具有从一幅图像中发现是否存在人脸,以及对
分布式系统设计的一个重要问题就是如何让在不同节点上运行的各部分协同工作,分布节点间能够协同工作的关键问题是节点间的有效通信。节点间有效通信需要一个可靠的消息传递服
人脸识别技术作为一种重要的生物识别技术,具有广泛应用价值,它使用便利、应用安全,受到广大人们的青睐。虽然人脸识别研究已历时几十年,在理想可控制环境下的识别率可以达到
本文从实际应用出发,设计了嵌入式通信处理器的硬件平台,并进行了此平台系统软件的引导、移植以及应用程序的开发,最终实现了此通信处理器的多串口通信和网络通信的功能。本