论文部分内容阅读
医院医疗质量关乎患者的诊疗康复以及社会公众对于医院的认知形象。评价医疗质量是医院医疗质量管理的关键部分。医院医疗质量主要根据医疗质量指标进行评价。目前评价医院医疗质量的方法主要有两类:通过统计学方法对某类医疗质量指标开展统计分析;医疗质量多维综合评价方法,如综合指数法、秩和比法等。统计学方法与综合评估法均不能对医疗质量指标作出预测分析。可见,利用数据挖掘方法对医疗质量指标进行预测分析的研究具有明显的科研及应用价值。在研究了大量国内外医疗数据挖掘与医疗质量评价相关工作的基础上,本文基于医院实际数据利用决策树C4.5、朴素贝叶斯分类器及贝叶斯最优分类器方法对医疗质量指标开展预测分析进行了研究。主要研究工作与贡献如下:(1)对决策树C4.5、贝叶斯分类算法进行全面的理论阐述与详细的步骤分析。首先,阐述决策树、贝叶斯分类及相关概念的意义,引入相应计算公式。其次,论述C4.5算法中信息熵、信息增益、分裂信息度量与信息增益率以及贝叶斯分类算法中极大似然假设与极大后验假设。最后,给出了本文中C4.5决策树、朴素贝叶斯分类器及贝叶斯最优分类器的算法步骤与部分伪代码实现,并分析了各自特性。(2)提出并实现了构建C4.5决策树挖掘模型对医疗质量指标进行预测分析的方法。首先,对医院住院病案首页数据开展数据预处理,并划分为训练数据集、验证数据集与测试数据集。其次,根据训练集分别基于平均住院天数、诊断符合率两项医疗质量指标构建C4.5决策树。再次,基于验证集通过错误率降低修剪法对决策树进行修剪,并利用测试集对修剪前后的决策树模型分别进行分类预测实验。结果表明:修剪前后的平均住院天数及诊断符合率决策树模型预测准确率分别为81.95%、82.92%和83.79%、85.03%。(3)提出并实现了构建朴素贝叶斯分类器与贝叶斯最优分类器挖掘模型对医疗质量指标进行预测分析的方法。首先,根据训练集分别基于平均住院天数、诊断符合率两项医疗质量指标构建朴素贝叶斯分类器及贝叶斯最优分类器。其次,利用测试集对分类器进行预测分析实验。结果表明:对于平均住院天数,朴素贝叶斯分类器及贝叶斯最优分类器预测准确率分别为80.63%与84.82%,对于诊断符合率,两者预测准确率分别为82.01%与86.15%。(4)设计并实现了医疗质量数据仓库与医院医疗质量综合分析系统。首先,从概念、特性与体系结构对数据仓库进行了全面阐述。其次,基于数据抽取方式、主题、维度、粒度与层次划分、事实表与维度表5个方面设计并实现了医疗质量数据仓库。最后,设计并实现了医院医疗质量综合分析系统,并集成数据挖掘模型。本文先后提出并实现了基于决策树C4.5、朴素贝叶斯分类器及贝叶斯最优分类器算法对医疗质量指标进行预测分析的方法。并通过实验对上述算法进行了性能对比和分析,结果表明:三类算法都能达到较高的预测准确率,其中贝叶斯最优分类器最高,朴素贝叶斯分类器最低。上述方法均具有较高的科研及应用价值,可以在医院医疗质量相关研究领域中进行推广应用。