【摘 要】
:
语料库的数量和质量对基于机器学习的命名实体间语义关系抽取的性能具有重要的影响,而语料库的人工标注是一项十分耗时又费力的工作。另一方面,多语言语料库的出现以及机器翻译
论文部分内容阅读
语料库的数量和质量对基于机器学习的命名实体间语义关系抽取的性能具有重要的影响,而语料库的人工标注是一项十分耗时又费力的工作。另一方面,多语言语料库的出现以及机器翻译技术的发展,为研究多种语言之间的一致性和互补性提供了良好的契机。本文提出了三种跨语言关系抽取的方法,旨在提高多语言关系抽取性能的同时降低对语料库标注量的需求。研究内容包括以下三个方面:1)基于机器翻译的跨语言关系抽取。首先利用机器翻译产生翻译语料,然后进行实体对齐,最后直接将映射后的关系实例添加到目标语言训练集中,帮助目标语言进行关系抽取;2)基于双语协同训练的关系分类。给定小规模标注语料和大规模未标注语料,以自举的方式将一种语言中可靠分类的关系实例所对应的翻译实例添加到另一种语言的训练语料库中。两种语言上的关系分类互相帮助,共同提高;3)基于双语主动学习的关系分类。将主动学习方法应用到中英文双语关系分类中,在挑选信息量最丰富的未标注实例时,使用联合置信度来综合考虑一个实例在两种语言中的分类置信度。在ACE2005中/英文语料库上的关系抽取实验表明,无论以何种方式使用翻译语料,一种语言中人工标注和自动标注的关系实例对另一种语言的关系抽取都具有一致且稳定的帮助作用,并且当训练语料规模较小时,这种帮助就尤为显著。
其他文献
为了促进杜仲产业健康持续发展,针对我国杜仲工程技术研究和产业发展中存在的突出问题,提出了杜仲育种工程技术、杜仲良种繁育工程技术、杜仲高效生产工程技术、杜仲胶等绿色提
主要介绍了煤料水分、 焦油渣配量、 型煤生球养护温度、 养护时间对不同煤种所制型煤强度的影响.对抗压强度相对较高的气煤配入焦炉生产产生的固废后进行了型煤强度变化的试
公积金制度在我国产生时间短但发展迅速,并在每个特定时间段为我国改善住房条件发挥着重要的作用。随着国家对公积金在调节住房消费过程中的重视程度的提高,公积金业务发展迅速,惠及职工人数也越来越多。各地公积金管理中心积极挖潜扩面,围绕供给侧改革的总要求,千方百计征缴公积金,按政策及时足额保障广大职工的支取和贷款的需求。公积金建缴、支取和贷款业务量日益增多,现有的服务水平已经无法满足公众的需求,服务质量投诉
老淡干,是胶东渔民传统海参加工方法,表面看起来很像媒体说的盐干海参,其实完全不同,它是传统加工淡干海参的鼻祖。在此,笔者向大家简要介绍一下老淡干传统工艺的加工流程及
韦伯在《儒教与道教》中认为儒教伦理阻碍了资本主义在中国的发展,建立在中国社会结构基础上的儒教在一定程度上为独裁制和官僚制度服务,同时儒教的追求、经济信念、伦理中心
社会科学研究的主要任务是探求因果关系,因果关系的本质和形态是多元的。本文综述了政治学家围绕因果关系展开的讨论,系统梳理了在政治学研究中理解和构建因果关系的四种传统
目的了解南京集中式餐饮具消毒单位卫生状况,为制定监管对策提供依据。方法对南京市52家集中式餐饮具消毒单位进行现况调查,抽样检测其中22家的产品,并对结果分析。结果大多数集
某省军区通过一年多的采购改革实践,探索出了军以下部队物资集中采购改革实行“一级管理,两级采购,三级计划”的基本管理模式。这对深化军以下部队物资采购改革工作具有积极
毛泽东是社会主义法制建设的重要奠基人。新中国成立之后,他既担任党的领导工作,又担任国家的领导工作。这一时期,毛泽东运用马克思主义关于国家政权和法的学说,吸收借鉴中外优秀
基金业绩评价与其投资风格是密切相关的,投资者通过对基金投资风格的研究分类,可以选择适合于自己投资偏好的基金进行投资。本文在对开放式基金进行分类研究的基础上,抓住不