基于深度学习的中文组织机构名分级识别

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:muyue3122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
按隶属层次划分中文组织机构是抽取机构关系和构建机构知识图谱的重要环节,对后续知识挖掘工程有着重要影响,而目前相关研究并没有得到学术界的关注,在中文机构命名实体识别领域内很少被探索。近年来,尽管中文机构命名实体的研究已经有了极大的进步,但是,由于中文机构名的复杂性、随机性和动态变化,使得现阶段研究仍然达不到中文机构细粒度划分的需要。本文主要研究如何准确识别中文组织机构名,按隶属层次解析划分层级结构并提取机构间关系,进而克服中文机构知识图谱构建的瓶颈。本课题主要从中文机构命名实体识别的发展历史和基本方法的研究入手,进而对现阶段的中文机构实体识别以及中文机构名的分级进行探讨。在本文中,我们不但研究了采用不同的传统机器学习方法解决该任务,还研究了如何通过基于深度神经网络的序列标注模型对中文机构名进行准确高效的分级识别。实验结果表明,本文优化后的CNN模型效果优于传统模型(Decision Tree,MLP,Linear SGD,SVM)和改进后的LSTM模型,分级识别准确率高达75.4%。论文的研究内容和创新点主要概括为以下两方面:1、本课题实现了如何在中文机构名识别的基础上做多级(最多10级)机构名称的识别与划分。同时,传统的机构名识别是在普通文本里做的,本任务的数据是限定在地址名录中,没有上下文信息。另外,传统的机构名识别任务比较独立,不考虑机构名之间的关系,本任务需抽取机构间的隶属关系。基于上述考虑,本文提出了中文机构名分级识别方法,包括机构层级划分的标注方法,基于汉字向量的数据集的构建,以及分级标注模型框架的搭建。2、为了准确提炼组织结构层级隶属关系,在层级划分预测中,不仅实验了传统模型(Decision Tree,MLP,Linear SGD,SVM),还采用了现阶段主流深度神经网络模型,首先用深度神经网络将中文机构名表示为低维空间的字向量形式,更高效的代替了传统的人工特征模板,然后采用不同的深度神经网络包括长短时记忆神经网络和卷积神经网络进行序列标注和机构层次类别划分,通过基于NNLM的字向量模型结合深度神经网络解决目标任务。
其他文献
祖国未来建设和发展人才的重要储备资源是当代中学生,因此中学生社会责任感的培养越来越受到国家的高度重视。初中阶段是学生成长的重要时期,培养学生的社会责任感是学生人格成长与学科核心素养发展的需要。生物学科中有着丰富的培养学生社会责任感的相关资源,因此在初中阶段培养学生的社会责任感要充分发挥生物学科的重要引导作用。本文基于生物学社会责任这一核心素养,探讨了在初中生物教学中培养学生社会责任感的教学策略。首
改革开放40多年来,我国经济社会发展取得了举世瞩目的成就,人民总体生活水平得到了极大的改善和提高。但是,也随之出现了经济与社会发展之间的不平衡、不充分以及分配格局不合理的现象。在此种情况下,如何保持经济稳定健康的发展,保证社会制度建设的公平正义,对于我国建设社会主义现代化有重要意义。对此,在党的十八届五中全会上习近平总书记提出了共享发展理念。共享发展理念是党和国家在新的历史发展时期,针对我国经济社
随着现代社会对能源的巨大需求,能量存储系统——尤其是电池和电容器系统,正逐步成为人们关注和研究的重点。辉钼矿(二硫化钼,MoS2)具有类石墨的层状结构且成本低廉,从而在电化
党的十九大报告指出:“中国特色社会主义文化,源自于中华民族五千多年文明历史所孕育的中华优秀传统文化,熔铸于党领导人民在革命、建设、改革中创造的革命文化和社会主义先进文化,植根于中国特色社会主义伟大实践。”红色文化是中国特色社会主义文化的重要组成部分,蕴含着伟大的革命精神和厚重的历史文化内涵,承载着中国共产党人的初心和使命。在新民主主义革命过程中,在山西这块神圣的红土地上,中国共产党领导山西人民展开
新中国成立后,在高度集中的计划体制下,城乡之间形成了经济和社会分治发展的二元结构。这种城乡二元结构和财政政策的作用效果密切相关。党的十六大以来,国家推出统筹城乡发展、新农村建设、乡村振兴等重大战略举措,指出破除城乡二元结构是我国实现社会主义现代化的必然要求,城市和乡村必需协同发展。本文从财政视角切入,分析财政政策在城乡二元结构演变过程中的影响。首先分阶段梳理城乡二元结构演变中的财政政策作用效果。(
“一带一路”倡议从提出到发展至今已经进入到全面的合作的实践阶段,我国作为主要的参与国积极投入到建设中,习近平总书记出访了中亚及东南亚地区的多个国家,为推动丝绸之路经济带和21世纪海上丝绸之路发展作出努力。国与国之间的经济合作领域不断扩展,合作方也越来越多元,经济活动的频繁往来也推动了国家之间的文化交流、民众的互动。实践情况表明,基础设施的建设是带动沿线不发达国家和发展中国家提高国民经济水平和带动经
学业情绪是指学生在学习的全过程中所体验到的各种情绪的总和。学业情绪的高低直接影响着学生的学习成绩以及身心健康发展。外来务工人员子女由于经济条件、生活压力、家庭和学习环境等与当地学生相比往往处于劣势,会在学习过程中出现学业情绪上的各种状况。本研究试图揭示乌鲁木齐市初中外来务工人员子女学业情绪的现实状况及其表现出来的特征,并针对特征进行有效的干预。研究首先采用信效度较高的由董妍、俞国良(2007)编制
创新活动为企业的生存和发展提供了源源不断的内生动力,是企业保持核心竞争力的关键因素,已成为近年来学者们的研究热点。已有研究表明,企业的创新绩效同时受到企业内外部治理机制的影响。一方面,内部控制机制贯穿于公司的生产经营和管理决策等各个环节,能够合理保证企业经营合法合规、提高企业经营效率和效果等,与企业的价值创造活动息息相关。创新投资活动兼具周期长和高风险的特点,离不开企业内部控制机制的有效运行,因而
邮政储蓄银行洛阳市分行于2008年4月在偃师支行开始试点小额信贷业务,2008年7月全市推广小额信贷产品,10年来取得了较好的成绩,资产质量一直处在较高水平。然而,2014年开始伊川担保公司大面积跑路引发的逾期爆发以及洛龙支行车贷逾期的爆发给全市小额信贷的发展蒙上一层阴影,除了带来巨大的经济损失的同时更是对信贷员的信心造成了极大的冲击,导致邮储银行小额信贷的发展连续两年出现了负净增的情况,伊川的小
在数字经济背景下,高技术服务业作为高科技和服务业融合的产物,具有较强的产业关联性,将高技术服务业投入到各个行业会对整个行业的发展有较强的影响力,其高增值性、高渗透性、高技术性是企业重要的创新投入要素,而这种投入对产业数字化有着重要的作用。基于此,本文旨在探究高技术服务业开放与产业数字化直接的关系。不同以往高技术服务业开放对产业升级影响的研究,本文结合时代背景研究了高技术服务业开放对产业数字化的影响