论文部分内容阅读
医院感染(院感)强调感染是患者在医院诊断过程中获得,表现形式包括两种:1)患者在出院前即表现出相应症状,这类医院感染更加明确;2)患者在住院期间获得,但出院后才表现出相应症状,这类医院感染存在很大争议。医院感染的检测是医院进行院感管理的重要内容之一,同时也是医院进行院感控制的难点和重点,且对于医院感染诊断最关键的步骤就是判断病人是否感染,而由于感染类型复杂,且部分感染间临床表现十分相似,区分难度大。因此一个可以支持对病人的感染情况进行诊断的院感诊断辅助系统对于医护人员来说越来越重要。电子病历(EMR),即利用电子设备,如计算机中的数据库或云端的云空间,存储病人纸质病历中的全部病历内容,可以通过现代化的数据访问接口快速、准确的获取病人信息,且随着电子病历的不断推广,目前也积累了大量电子病历数据,同时文本分类算法一直是数据挖掘和机器学习领域研究的重点内容。本文对不同感染的电子病历数据进行处理分析,利用机器学习方法对不同感染的症状组成、症状与感染间的关系进行学习建模,通过一系列模型训练方法得到以电子病历为对象的感染智能诊断系统,通过输入病人的病历信息得到该病人可能患有的感染。本文的主要工作如下:·给出了一种适合电子病历文本的数据预处理流程。首先需要过滤病历文本中的否定短语;其次,为了提高分词质量,本文构建了一个包含常见中文疾病和药品名称的专业词典;最后对病人文本中名词+数量词和名词+形容词这两类特殊的语法结构的分词结果进行后处理,重新组合。·提出了一种基于类别区分度的特征选择方法。该方法针对病历文本中症状的组成和分布的三个特点,计算出每个症状对于不同感染的代表度,并根据代表度进行排序后选择代表度大的症状。实验结果表明基于类别区分度的特征选择方法相较于传统的过滤式特征选择方法,如卡方检验更有效。·提出一种基于多标签分类算法的感染智能诊断模型。首先确定不同感染间的关联性,然后根据关联性选择合适的多标签分类算法构建分类模型。为验证分类模型的性能,本文利用XY医院院感科的医生经验和感染知识构建了一个感染诊断专家系统,并比较了两个系统的性能差异。·为分析特征选择方法和智能诊断模型的适用性,本文利用XY医院和ZD医院院感科的病历数据,进行特征相似度和模型迁移能力的实验,在验证特征选择方法和智能诊断模型适用性的同时,比较了两家医院不同感染数据的质量差异。