词义消歧中若干关键技术研究

来源 :武汉大学 | 被引量 : 4次 | 上传用户：w34gss

【摘要】

：

词义消歧(Word Sense Disambiguation)是指采用一定的策略或算法,在给定的上下文中自动确定歧义词的正确词义的任务,是自然语言处理领域中词汇级别的最大难题。词义消歧是自

【作者】

：

陈俊鹏

【出处】

：

武汉大学

【发表日期】

：

2012年01期

【关键词】

：

词义消歧词语链词义可靠性 ConceptNet 非负矩阵分解社会标注系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

词义消歧(Word Sense Disambiguation)是指采用一定的策略或算法,在给定的上下文中自动确定歧义词的正确词义的任务,是自然语言处理领域中词汇级别的最大难题。词义消歧是自然语言处理技术中一项基础性的技术,对于文本挖掘、自动文摘、机器翻译、以及信息检索等众多自然语言处理技术的性能提高有着重要影响。因此如何提高词义消歧的性能也成为人们的迫切需求。本文针对词义消歧中存在的问题和难点,对词义消歧中的若干关键技术进行了深入的研究,具体的研究内容主要包括：1.为了有效的利用消歧知识源,尤其是多种异构的消歧知识源中蕴含的知识。本文提出了一种基于词语链和词义可靠性的词义消歧方法。该方法基于词语链的思想,构建出描述整个文档词义内聚性的语义关联图,然后基于该语义关联图实现对歧义词的消歧。语义关联图可以有效的集成多种消歧知识源,提高了消歧知识源的利用率。此外该方法提出了词义可靠性的概念,用以度量词义的可靠性,从而给予语义关联图中节点以相应的权重,可以有效的提高稠密的语义关联图的消歧精度。2.词义消歧系统严重的依赖于知识。然而消歧知识的难以获取和匮乏,给词义消歧研究的发展造成了极大的阻碍。针对这个问题,本文将一个海量的在线常识知识库ConceptNet引入到消歧知识源,有效的缓解了消歧知识源匮乏的问题。由于ConceptNet中的概念存在歧义问题,不能直接作为消歧知识源。因此本文还提出一个将ConceptNet中歧义概念自动消歧的方法。并将消歧后的ConceptNet中的常识知识和WordNet相结合,作为消歧知识源。通过在公共测试集上的测试,说明使用消歧后的ConceptNet扩展的消歧知识源,可以有效的提升基于知识的词义消歧系统的性能。3.在词义消歧研究中,词义字典是能够进行词义消歧的前提条件,选择的词义字典是否合适直接决定词义消歧的质量。然而在特定领域中的词义消歧,例如社会标注系统中的标签消歧,由专家构建的预定义词义字典无法有效覆盖歧义词的词义。在这种情况下,需要构建符合待消歧数据中词义分布的词义字典。针对这个问题,本文提出了一种基于非负矩阵分解的无指导的词义消歧方法。该方法可以自动构建出匹配对应社会标注系统的词义字典,该词义字典可以有效的覆盖社会标注系统中的标签,并且不存在预定义词义词典中大量冗余的以及缺失的词义,从而有效解决社会标注系统中标签歧义问题。此外,对于从社会标注系统中自动构建出的词义字典,目前没有合适的评估其质量的方法。本文提出一种自动评估方法,可以客观、有效地评估自动生成的词义字典质量,避免了成本高昂的人工评估方法。

其他文献

基于SERVQUAL评价法的门诊采血服务质量评价分析

目的 :应用Servqual评价法调查门诊采血护理服务质量现状,分析影响患者感知服务质量的主要因素。为采取针对性措施促进优质护理服务提供参考依据。方法 :应用Servqual量表对

期刊

Servqual评价法门诊采血护理服务

子宫内膜不典型增生患者子宫内膜癌漏诊因素分析

研究目的：通过回顾性分析诊断性刮宫或宫腔镜检查病理诊断为子宫内膜不典型增生,进而行手术治疗的患者的临床资料,评价这两种子宫内膜取样方式及术中冰冻病理在子宫内膜不典型

学位

子宫内膜不典型增生子宫内膜癌漏诊诊断性刮宫宫腔镜检查术中冰冻病理

甲状腺激素替代治疗对妊娠期甲状腺功能减退孕妇妊娠结局的影响

目的探讨甲状腺激素替代治疗对妊娠期甲状腺功能减退孕妇妊娠结局的影响。方法2014年6月至2018年2月该院收治并分娩的妊娠期亚临床甲状腺功能减退孕妇188例(A组)及妊娠期甲状

期刊

妊娠期甲状腺功能减退甲状腺素替代治疗妊娠结局围生儿结局

深井泵失效原因分析

通过对某采油作业区CYB/32/38有杆泵失效原因的现场调查和综合分析,得知影响有杆泵抽油系统失效原因主要有9个方面。从油井结蜡、结垢、出砂、腐蚀程度、井身结构及柱塞抽油

期刊

深井泵深井泵故障失效原因

浅议任务驱动法在工匠精神教学中的应用

呼唤工匠精神的回归成为社会的主旋律之一,"匠人制造""匠人品质"等体现工匠精神的名词越来越频繁地出现在我们的日常生活中,工匠精神已经开始引领一种新的时代潮流,获得全社

期刊

任务驱动法工匠精神教学方法

基于OBE的工业机器人技术专业实践教学体系研究与构建

实践教学体系是专业人才培养方案的重要组成部分,影响着人才培养的质量。针对工业机器人技术专业实践教学体系中存在的问题,笔者研究与探索了基于OBE理念下的体系建设思路、

期刊

工业机器人OBE实践教学体系校企双平台

浅谈中职学校计算机教学中学生创新能力的培养

科技创新能力逐渐成为各行业的核心竞争力.对此,中职学校与教师必须提高对学生创新能力培养的重视程度.本文针对当前中职学校在计算机教学中存在的问题展开分析,并提出培养学

期刊

中职学校计算机教学创新能力培养

基于I^2C总线技术的等离子喷焊系统的研究

阐述了基于I2C总线技术的等离子喷焊过程控制系统的设计原理,介绍了软硬件及接口设计技术.实践表明,采用I2C总线技术,不仅使系统的芯片大大减少,系统的灵活性增强,而且提高了

期刊

I^2C总线单片机等离子喷焊I2 C busmicrocontrollerplasma welding

数字经济与产业结构升级——基于要素流动视角下的空间计量检验

本文从理论层面分析了数字经济驱动我国产业转型升级的内在机理,即通过增加要素流动节点和管道、提升要素资源配置效率、增进各要素之间良性互动,来调整改善产业规模、产业效

期刊

数字经济要素资源产业结构空间计量要素流动节点

词义消歧中若干关键技术研究

其他学术论文