基于深度学习的中文命名实体识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xy0382
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然处理领域中的基础任务之一。命名实体识别准确率的提高对于信息检索,自动问答,关系抽取有很大的帮助。近年来随着各行各业大量数据的产生,对命名实体识别系统的准确性和适用性都提出了新的要求。本文的主要工作如下:(1)研究了基于统计学进行命名实体识别的原理,指出了统计学方法的缺陷和不足,并研究了使用深度学习进行命名实体识别的最新方法。(2)在深度学习的基础上,研究了现有的词向量进行命名实体识别时的缺陷和不足,改进了现有词向量的训练方法,提出了加权词向量。(3)分析了现有的深度学习框架进行命名实体识别时存在的问题,并提出了改进的框架。研究了命名实体识别在多领域效果中精度不高的原因,提出了基于语义分析和神经网络的命名实体识别框架;研究了命名实体识别与机器翻译的相似性,提出了以机器翻译的方式解决命名实体识别问题,改进了机器翻译的模型,并将改进的模型应用在命名实体识别问题中,取得了不错的效果。(4)最后,设计实验验证了提出了新框架的有效性并介绍了命名实体识别在智能问答系统中的应用。
其他文献
<正>什么是美?听李健的歌是一种美的享受,他的浅吟低唱,如诗般直击人的心灵,让人沉醉,让人迷恋;品《班主任修炼之道》亦成为生活中美的领悟,那真诚的文字诉说着一程程美好的
政府统计调查体系是由政府统计体制决定的。现有政府统计体系由政府综合统计系统和政府部门统计系统组成,政府综合统计体制实行“统一领导、分级负责”的管理模式。国家统计局
随着FPSO在世界范围内的广泛应用,永久系泊系统作为FPSO的核心设备,也根据不同的应用环境和自身特性划分为许多型式.对于船形FPSO的永久系泊系统来说,较为常见的为单点系泊系
随着西部大开发政策的深入实施,以及青藏铁路的全线通车,青海、西藏两省区开始重视加强区域经济合作,青藏铁路经济带的探索和建设也得以展开。在青藏区域经进交流和合作过程
本文探讨了计算机多媒体智能中控网络系统的工作原理,分析了中控网络系统的硬件设计、中控网络管理系统的设计,研究了多媒体中控系统的使用。
生物医学命名实体识别是生物医学信息提取的基础和关键任务,准确地识别出生物医学命名实体对于基因关系抽取和生物知识发现等复杂任务有着至关重要的作用。生物医学领域的命
温室白粉虱属同翅目粉虱科,是一种多食性的害虫。随着保护地栽培面积的扩大,温室中小环境气候非常有利干其繁殖和越冬。目前,已知在我国的东北、华北、华东和西北近20个省(自治区
本项目教师端和学生端能够实现一对一或一对多的无线通信,具备了学生端自动签到,教师端提问、答疑提示以及无线抢答器功能。并且结构简单、成本较低、携带便利。