基于深度学习的医学命名实体识别研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:hobo_man
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗领域的电子信息化建设,医学病历等文本数据的数量成指数级增长。互联网信息系统的发展使得医疗行业能够更加快速便捷地收集患者的就诊信息,但是医学电子病历数据仍存在异构、分布式、碎片化等特点。要从海量的医学数据中进行有价值的数据分析和信息挖掘,需要将医学数据结构化处理。通过自然语言处理技术的运用,对医疗领域的文本数据进行命名实体识别,将为数据的结构化表示奠定基础。高质量的命名实体数据是搭建智能医疗系统不可或缺的基础环节,然而高质量的实体数据通常由专家手工标注而来,成本高、耗时长。所以使用有效的计算机算法进行命名实体识别,提高算法识别的准确率,是医疗文本数据挖掘领域工作中的重要环节。传统的命名实体识别关注于人名、地名等常见实体类型,但医学领域更加关注症状、器官、治疗方法、药物、疾病等实体。由于医学领域数据的特殊性,医学命名实体识别很少能有模型达到令人非常满意的效果,因此医学命名实体识别仍是一项非常艰巨的任务。本文首先介绍了历年来国内外医学命名实体识别的研究现状,主要总结了基于深度学习模型命名实体识别研究的发展历程。本文基于标准深度学习模型LSTM-CRF网络,对LSTM门控机制进行改进,提出了 SE-LSTM模型,有效提升了识别准确率。此外,本文将自然语言处理领域中最新的研究进展预训练模型应用到医学命名实体识别领域中,将任务与BERT和XLNet相结合。实验证明,对LSTM的门控机制修改后的SE-LSTM模型,F1值有1-3%的提升。将BERT和XLNet加入模型结构,在数据集较大的情况下,有较为明显的提升效果。
其他文献
本翻译报告的原文是大卫·马丁的澳大利亚儿童小说《休吉》,第一章至第四章节选的内容,此书尚未翻译成中文。选取此段的原因是故事的开展以及高潮主要体现在前半部分,休吉正是文中主角,他是一名典型的澳大利亚原住民,黑皮肤,卷头发,住在营地;他也是澳洲多样性文化的代表,在成长的过程中,休吉不断的去接触到外界的事物和与他不同肤色的人们,这让他的认知也开始发生变化。原文非常真实,细腻的刻画了作为儿童主人公休吉的所
学位
以天然气、氢气等为代表的清洁燃料在能源和化工领域使用非常广泛,对于以液体形式储存该类物质的储罐属于重大危险源,一旦发生破裂事故,将给周围设施和人员带来极大危害。易
水凝胶作为一种优良的载体,可以负载药物或者生物大分子用于疾病的治疗与组织组织的修复再生。然而,大多水凝胶载体难以兼顾良好的生物相容性与友好的刺激源以达到药物的可控
《义务教育英语课程标准》(2011)规定,小学毕业时学生应达到二级水平。但毋庸讳言,农村小学的英语教学水平与我国城市学校相比,存在很大差距。在教学实践中,大部分农村小学毕业生并没有达到这个要求。其主要原因是,在农村这一特殊的教育环境中,小学英语科目面临重视程度不够,教学资源匮乏,师资严重不足等诸多问题,且学生大部分为留守儿童,家庭辅导跟不上,英语学习比较吃力。随着年级的增长,英语课程内容和难度逐步
学位
无线传感器网络(Wireless sensor networks,WSNs)具有自我组织、随机分配和广泛应用的特征,在环境监测、目标确定、健康监测、危机管理、国防等领域发挥着不可替代的作用。面对不同的应用场景,需要设计不同的路由协议,由于WSNs部署环境的特殊性,在能量有限的情况下,如何保证数据传输的准确性,提高网络内各个节点对能量的使用率,延长无线传感器网络的生命周期已经成为人们关注的焦点。在此
激光熔化沉积技术具有热影响区小、不受材料限制、能加工制造复杂结构件等诸多优点,因而被广泛应用于零部件的修复、表面改性以及复杂结构件的制造等领域。然而低粉末利用率(
写作在高中英语学习中起着非常重要的作用,是高中生语言输出的重要途径,其写作水平在很大程度上反映了他们的语言综合水平,因此英语写作教学是高中英语教学中的一个重点。随着写作教学研究的深入,各种各样的写作教学法不断被提出,“以读促写”教学法就是其中的一种。该方法认为读写之间存在紧密的联系,大量的阅读可以提高学生的写作水平。普通高中英语课程标准(2017年版)也提出,读是理解性技能,写是表达性技能,理解性
学位
国家教育改革与发展规划纲要(2010-2020)提出要加强教师队伍建设和促进教师专业发展。专业技能是英语教师专业发展中的重要因素,即教学技巧和教学能力。专业学习共同体是一个有共同愿景和共同目标的学习型组织。目前探讨专业学习共同体对专业技能发展影响的研究相对较少,对高中英语教师群体的研究更少(张兆芹、刘紫馨,2018)。因此,本文旨在从专业学习共同体角度对高中英语教师专业技能发展影响的现状展开调查,
学位
此英汉实践报告由原文、译文及翻译策略组成。其中,翻译原文节选自小说《独角兽学校之寻宝》。该小说是一部优秀的儿童文学。到目前为止,这部小说还没有中文译本。译者在翻译原文过程中以接受理论为指导,采用了多种翻译策略解决了翻译中存在的问题。译者首先从词汇和句法上对原文进行了分析,对原文特点有了总体的把握。译者着手翻译之前做了充足的译前准备,查阅了有关儿童文学和接受理论的相关资料。译者从词汇和句法层面对原文
学位
由于应试教育的缺陷与其他条件的限制,口语教学是一直是我国英语教学相对薄弱的环节,尤其在一些偏远农村地区。农村地区外语教育发展在不断进步,但由于教学资源的缺乏和城市化进程的加快,其与发达沿海地区仍有较大差距。现行的《义务教育英语课程标准》(2017版)对口语技能的要求越来越高,其三级要求初一的学生:能用英文简单交流熟悉的话题,简单角色扮演,讲述简短小故事,背诵一些诗和歌谣,唱一些英文歌曲等。所以如何
学位