基于端到端记忆神经网络的医学电子病历分类与女本嵌入表示

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lwz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习模型的提出与优化以及算力支持的逐渐强大,人工智能(Artificial Intelligence,AI)渐渐渗入到各行各业,例如AI+教育、AI+安防、AI+医疗等等。而AI赋能医疗近年来受到极大的关注。本课题旨在研究分析所给特定医学电子病历,结合其内容组成,搭建合适的深度学习模型,实现该类医学电子病历的分类任务。对于医学电子病历分类问题,本文主要做了如下研究。首先搭建了传统的统计机器学习模型进行病历分类研究,包括逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和梯度提升树(Gradient Boosting Decision Tree,GBDT)。针对统计机器学习模型有限的学习能力及其对手工特征的强烈依赖,采用深度学习模型对此类问题进行建模。在研究该类电子病历的内容组成,进行相关深度学习技术的背景调研之后,搭建端到端记忆神经网络模型(End-to-End Memory Networks,MemN2N)进行分类建模,取得了相比于传统统计机器学习模型较高的分类准确率。此外,对于MemN2N相关模型的文本嵌入表示方法,目前有直接相加法和双向长短期记忆网络(Bi-directional long-shortterm memory network,Bi-LSTM)方法。针对这些模型所处理的多跳推理问题,分析其所给的开源数据集之后,分析到对于每一个问答对原文的问题的答案都聚焦于原文中的某一个或者某几个单词。针对上述挑战,本文提出卷积端到端记忆神经网络模型(Convolutional End-to-End Memory Networks,CMemN2N),其主要为MemN2N提出了一种卷积架构,以在给定随机初始化的词向量的情况下生成更好的原始文本的嵌入表示。它在计算句子的向量表示以捕获局部有用信息的过程中引入了卷积架构。同时,为保证对于原文及其对应问题都获取到了相关有用的局部信息,因此本文将卷积体系结构同时应用于原文和问题的嵌入表示上。在此种情况下,本文提出的模型可以同时接收原文和问题中的重要信息,并将它们进行相关性分析,避免同时考虑所有有效以及无效的信息而导致信息冗余或噪音信息。最后,将改进后的CMemN2N模型与门控端到端记忆神经网络(Gated end-to-end memory networks,Gated-MemN2N)及双向长短期记忆网络端到端记忆神经网络(Bi-directional long-short term memory network MemN2N,Bi-LSTM-MemN2N)模型在公开数据集(bAbI task)上进行实验,实验显示CMemN2N在公开数据集多跳推理问答任务上的平均回答准确率高于其他对比模型。
其他文献
具有孔洞的金属簇合物已成为当前化学界的研究热点。人们对此已进行了很多的研究,也合成出大量结构多样的配位聚合物簇合物,其成果大都集中在含氮杂类配合物、羧酸类簇合物、
目的1.分析兔骨髓间充质干细胞定向诱导分化为血管内皮细胞并进行鉴定的实验过程、步骤及结果。2.研究诱导培养时间对所得血管内皮细胞NO分泌量的影响及意义。3.探讨以家兔替
近年来,PPP模式受到高度重视和发展,随着PPP模式在我国公共基础设施建设和公共服务领域大规模的应用和其逐步受到规范管理,PPP模式进入稳步发展阶段。但我国关于PPP模式的税收激励政策还停留在PPP模式发展之初。为适应PPP模式稳定的发展现状,出台相关税收激励政策,构建激励社会资本积极参与的相关政策体系就变得由为必要。我国财政部政府和社会资本合作中心(CPPPC)在2018年公布财政部PPP综合信
党的十九届四中全会以“坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化”为基本命题,提出了新时代实现“中国之治”的总体目标和战略部署。制度建设是推进国家治理体系和治理能力现代化最基本的路径,而权责清单制度作为巩固和拓展“放管服”改革的有效手段,应当成为国家治理体系和治理能力现代化的关键抓手。地方政府权责清单制度能够以清单形式理顺地方政府工作部门间的职责承接关系,规制政府交叉职责现象
目的:建立肺脾气虚变应性鼻炎(allergic rhinitis,AR)大鼠模型,并以鼻敏方进行干预,通过观察大鼠核因子-kappa B(nuclear factor-kappa B,NF-κB)信号通路对鼻黏膜水通道蛋白5(Aquaporin 5,AQP5)的表达影响,探讨“培土生金”法中药防治AR的作用机制。方法:1.采用烟熏+番泻叶灌胃+卵清蛋白致敏的方法制作肺脾气虚证AR大鼠模型。造模期间
目的:通过收集不稳定型心绞痛(UA)患者的病历资料并进行统计分析,观察其中医证型分布特点,对不稳定型心绞痛患者的中医证型与GRACE评分、红细胞分布宽度(RDW)水平的相关性进行研究,并探讨GRACE评分、RDW在不同证型的不稳定型心绞痛患者中,对30天内主要心血管不良事件(MACE)的预测能力差异。方法:采用回顾性研究方法,收集2017年1月至2018年12月急诊接诊符合UA诊断的患者376例,
随着计算技术的发展,传输数据的速率和吞吐率逐渐成为衡量一个系统性能的重要指标。不占用处理器资源,直接搬移内存中数据的DMA技术成为了一个可行的方案。本文对802.11ax Wi
激活素属于转化生长因子β超家族,是一种多功能生长分化因子,其作用具有明显的组织特异性。在激活素的信号转导通路中,由于Smads家族蛋白无法解释激活素作用的组织特异性,从
某公司新厂房布局设计,以厂房布局设计为研究对象,通过价值流图等工具详尽调研分析了在原厂房布局下公司生产系统各方面所存在问题,如搬运浪费过多、物流路线不合理、生产提
激光清洗作为一种新型表面处理技术,与传统酸洗和物理去污相比具有绿色环保,清洗能力强等优点。表面污染物经过脉冲激光辐照后能够实现快速去除,被广泛应用在金属表面的清洗预处理中,具有极高应用价值。在多晶硅生产中,还原炉内壁金属表面会形成一层较薄的污染层,如不及时清洗则会降低内壁金属表面的金属光泽度,加大企业生产过程中的能量损耗。因此,在不损伤基材原有使用性能的基础上,去除金属表面污染物,提高表面光泽度,