中文人物属性槽填充技术的研究与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:wangyuan1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人物属性是指姓名、性别、工作单位等基本个人信息,人物属性槽填充是指从自由文本中提取给定人物的属性信息,并填充到对应的属性槽中。人物属性槽填充从自由文本中获得人物的结构化信息,是一种重要的基础性信息抽取任务,对于进行人名消岐、事件追踪以及构建知识图谱等任务具有重要的价值。本文研究基于中文自由文本的人物属性槽填充,探索了多种针对不同情况的人物属性抽取方法,并基于此构建人物属性挖掘系统。具体包含以下几个方面的工作:(1)实现了一种基于Bootstrapping的中文人物属性槽填充算法,该方法基于少量人工规则,通过迭代自动生成大量的属性抽取规则,最后使用生成的规则提取并填充对应属性的属性槽。(2)实现了一种基于依存关系树的半监督属性槽填充算法,该方法通过依存关系树获取人物、属性候选词与触发词的关系,通过发掘属性触发词获得人物属性。实验结果表明,该方法在所有属性槽上的槽填充评估F1值均达到85%以上。(3)分别实现了基于长短期记忆(Long Short-Term Memory,LSTM)模型以及卷积神经网络(Convolutional Neural Network,CNN)模型的中文人物属性槽填充算法,分析对比了这些监督模型与上述半监督模型在人物属性槽填充任务上的优劣。(4)基于上述模型,实现了一个中文人物属性挖掘系统。
其他文献
知识表示与获取是人工智能中的关键问题,而规则获取是其中一项重要的研究内容。粒计算是一种对复杂问题进行分析、求解的数学模型。粗糙集理论作为其中一个重要的分支,主要是
冷轧带钢退火是冷轧工艺的重要工序,直接影响着钢板表面质量。本文以鞍钢冷轧厂罩式退火炉控制系统为研究背景,设计了罩式退火炉生产管理系统,实现生产、设备、能源的有序管
近年来,随着互联网的飞速发展,网络上产生了越来越多的数据,其中大部分数据为文本信息。面对这些海量的数据,如何利用机器学习技术从中挖掘出对用户有价值的信息一直是研究的热点,而自然语言处理中的文本分类技术使得人们分析、组织和管理大量文本信息成为可能。文本分类在情感分析、垃圾邮件检测、关系抽取和信息过滤等领域有着广泛的应用,因此,对文本分类技术的研究具有重要的研究意义和应用价值。本文研究了应用于文本分类
目的:胆汁淤积是胆汁分泌和排泄障碍的一种病理状态,急性胆汁淤积会迅速出现高胆红素血症,导致肝细胞死亡、肝纤维化、肝衰竭甚至死亡。到目前为止,有效的治疗方法依然有限,因此发现新的治疗方法尤为重要。熊去氧胆酸(ursodesoxycholic acid,UDCA)是我国治疗胆汁淤积的主要药物,但是一些患者对其反应较差。研究显示,双环醇是临床常用的保肝药物,能增强肝脏解毒功能、降低肝损害患者的血清转氨酶
本文以X公司列车供电装置研发项目为研究对象,根据项目实施过程中出现的几次重大节点延误现象,结合项目管理知识对其做出分析,分别基于项目组织形式,项目进度计划与控制,项目
智能手机在我们的生活中发挥了越来越重要的作用,而搭载智能手机的Android系统在权限访问控制方面却存在权限提升安全漏洞:低权限的应用程序可以通过访问高权限的应用程序来
随着LED驱动设备的逐渐发展,对其功能和性能有了更高的要求,如何高效地实现智能化调光和有效抵抗电磁干扰等问题已成为LED驱动系统的研究方向。然而,与线性调节器和电荷泵相比,开关电源因具有输入输出范围宽、成本低且转换效率高等优点,所以更适合作为LED设备的驱动控制核心。因此,本文设计了一款具有低EMI双模调光的Buck型LED驱动系统。本文首先分析对比了开关电源的拓扑结构和工作方式,从而选择了连续导
沉香为瑞香科(Thymelaeaceae)沉香属(Aquilaria)或拟沉香属(Gyrinops)植物含有树脂的芯材。为丰富沉香中化合物的骨架结构,为沉香的进一步开发利用提供科学依据,同时为进口沉香的鉴定提供理论依据,本研究采用多种色谱分离技术从一种国外沉香的乙醇提取物中分离得到25个化合物,通过波谱学方法分别鉴 定 结 构 为:(+)-12,13-dihydroxyguaiol(1)、rel-
时至今日,当代世界仍然未能摆脱资本的控制。资本已然成了贯穿现代社会历史发展的重要范畴。因此,关于人类社会发展过程的研究,特别是关于社会发展必经阶段的现代性的研究,对
塞缪尔·巴伯(Samuel Barber,1910-1981)是二十世纪美国最著名的作曲家之一,在音乐界享有极高的声誉和地位。他的音乐作品体裁涉及十分广泛,包括管弦乐、小提琴、钢琴、声乐