基于深度学习的病案ICD自动编码研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kejianghaoxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历的普及让ICD编码成了自然语言处理领域的热点问题,文本主要面向电子病历中病案文本的内容展开研究,提出了面向ICD编码任务的SHAN模型,以及面向语句采样任务的RESS模型。目前已有的ICD编码模型普遍为黑盒式的神经网络,在直接给出分类结果后,无法提供相应的分类理由依据;并且现有的模型几乎仅使用病历中单一部分的数据,忽略了病案中对分类有帮助的其他文本信息。为了解决以上问题,本文提出了SHAN模型,其很好地结合了病历中“病情描述文本”与“医生书写诊断”的文本信息。将“医生书写诊断”作为注意力分配依据,利用层次化的结构在以更高性能完成ICD分类任务的同时,为“病情描述文本”中与特定诊断信息相关性更高的句子分配更多的注意力权重,并将注意力分配情况作为该次分类的理由依据。在对比实验中,SHAN模型在MIMIC数据集以及本论文特有的中文数据集上表现出了优秀的性能,同时对ICD编码结果有效地提供了可解释性。在SHAN模型的研究过程中,我们发现“病情描述文本”中过多的语句数量会与分类器中有限的感知单元功能产生不匹配的现象,而且过多的句子数量会占用庞大的存储空间。针对以上问题,本论文提出了基于强化学习的句子采样模型(RESS),利用强化学习的随机探索思想,以分类器的性能变化程度作为引导,训练出一个模型,来判断语句在分类过程中的重要程度。通过实验,本论文验证了RESS模型能够有效地减少病情描述文本中无用语句的数量,并尽可能地降低语句数量减少而带来的分类性能下降。综上所述,本论文通过深度学习实验验证,针对数据未利用完整以及黑盒问题,提出使用层次注意力的SHAN模型,在完成ICD编码任务的同时,提供相关的语句作为可解释性依据;针对“病情描述文本”语句过多的问题,提出使用强化学习的RESS模型,在语句并无重要性标注的情况下,完成语句重要性的识别,有效减少了冗余的无用语句。
其他文献
在全球化的背景下,各国间越来越积极地进行着文化的交流与传播。语言是文化的载体,要学好一门语言,就必须了解其背后的文化。所以文化教育在英语教育中的占据重要地位。中日韩三国有相似的文化、历史背景,并且英语在三国都作为外语进行教学,三国的英语课程标准都强调学习者的文化意识和跨文化交际能力,所以对比研究三国高中英语教材中文化内容的特点,对于我国高中英语教材文化内容的提升具有一定的借鉴意义。本研究选取人教版
为了更好地强化学生自我教育、自我管理、自我服务的意识,在学校德育管理过程中积极推进“以礼仪教育为主线,以丰富学生课余生活、班级文化建设为两翼”的活动形式,构建学生“自我管理、自我教育、自我服务”特色德育管理模式,为促进学生人格健全发展不断努力。
人工智能技术的创新扩散研究是深入推进人工智能教育应用的关键。人工智能技术的快速发展推动了技术与教育的融合创新,促进了教育教学方式的变革。由于目前人工智能技术在教育领域的实践应用还处于初级阶段,教师对其在评价、管理等方面的独特优势仍在探索中。为推动人工智能在教育领域规模化、常态化应用,本研究以TOE理论为基础,从教师的视角出发,采用问卷调查方法,深入剖析技术、组织和环境三大维度的各因素对人工智能在教
搪玻璃用中厚钢板是制作搪玻璃设备的关键材料,要求钢板在搪玻璃过程中具有良好的贮氢性能和抗鳞爆性能,但长期以来主要使用普通压力容器用中厚钢板Q245R,极易产生鳞爆。因此,对比常用的含0.16%C+0.013%Ti(质量分数)的热轧正火态中厚钢板Q245R,设计并工业化生产了w(C)=0.10%、w(Ti)=0.10%的搪玻璃用热轧中厚钢板B245GT,通过光学显微镜、渗氢试验和透射电镜等研究和对比
<正>2014年9月至2015年4月,为配合基本建设,北京市文物研究所在北京市海淀区八里庄玲珑巷发掘了一处明清时期的宦官墓地。墓地位于海淀区东南部,东距二环阜成门桥约5公里,北为玲珑路,南临恩济街,西为蓝靛厂南路,东临北洼路,分布于明代寺庙摩诃庵(现为八里庄小学,全国重点文物保护单位)外的东、西两侧,可分为两个墓葬区(图一)。其中,
期刊
价值链重构是产业发展、优化、升级的必然结果,更是推动产业进步、改革、创新的重要动力之一。价值链重构的必然性要求乐团创作品牌必须要转变传统的营销理念、思路和模式,面对新的挑战与新的发展机遇,围绕乐团创作品牌的优势,结合其产业发展现状与定位,创新营销战略,提出更有效、更先进、更具竞争力的营销渠道和模式。
学位
《普通高中英语课程标准(2017年版2020年修订)》(以下简称《课标》)指出思维品质是指思维在逻辑性、批判性、创新性等方面所表现的能力和水平(教育部,2020)。同时《课标》指出英语阅读教学要促进学生学科核心素养全面发展,将学生培养为具备语言能力、文化意识、思维品质、学习能力的阅读者。但是在目前高中英语阅读教学中,教师仍旧将语言知识作为阅读活动重点,这就导致了学生缺乏思考的过程,其思维品质发展受
近年来,由于全国推行全过程工程咨询模式,使我国的工程咨询行业得到了快速发展,而对工程咨询企业的要求也越来越高,为客户提供全方位的造价咨询服务已成为我国工程咨询企业发展的必然趋势。由于在开展项目全过程造价咨询过程中,存在传统模式难以转变,规章制度不完善、复合型人才缺乏等问题。这些问题会制约着全过程造价咨询业务的发展,同时也会对企业的风险管理产生巨大的影响。因此,本文从造价咨询公司的视角出发,以全过程
政策环境评价是环境影响评价体系的重要组成部分,开展政策环境评价的技术方法、模式、框架等基础研究是促进中国政策环境评价制度构建和环境影响评价体系完善的关键。在对比分析以影响分析为主和以制度分析为主的两种政策环境评价模式的基础上,结合中国的政策体系和管理制度特点,分析了两种模式在中国的适用性,并为中国政策环境评价的发展提出了相应的建议:目前中国的政策环境评价仍应侧重于以影响分析为主的模式,在此基础上借