论文部分内容阅读
住院时长是医院合理分配病房床位的重要依据,是医院运转速度、医疗水平以及工作质量的重要体现。长期以来,患者住院周期长和病房床位周转率低的问题一直困扰着医院管理者。为了提高医疗资源的利用率以及缓解患者住院的经济压力,对患者住院时长深入研究势在必行。本文基于国内某三甲医院肿瘤科室五年多的直肠癌患者住院数据,对患者住院时长的分布和预测进行研究,为医院管理者在医疗资源的调度安排上提供一些参考。实际情况中,患者住院时长数据分布是不对称的,住院时长的均值无法体现实际住院时长分布的特征,医院管理者以住院时长均值为依据所作的决策可能会导致病床分配不合理,从而产生不必要的损失。因此,找出合适的分布模型来拟合住院时长具有重要意义。本文采用GMM拟合住院时长的经验概率分布,通过EM算法对模型进行参数估计,以AIC等统计量作为拟合效果的衡量指标。实证分析结果表明GMM在患者住院时长分布的拟合上,性能优于以往研究中常用的对数正态分布、伽马分布和威布尔分布,这为研究住院时长的分布提供新的思路。此外,分布拟合的研究只是通过住院时长数据来研究其分布形态,并不能体现出究竟有哪些因素影响着患者的住院天数。所以本篇论文还将当下热门的机器学习技术应用到住院时长的研究中,利用XGBoost算法建立住院时长预测模型,对影响住院时长的若干特征变量进行分析,然后以此预测患者的住院时长是否延长。实证分析将该模型与传统的CART决策树模型和逻辑回归模型进行对比,结果证明基于XGBoost算法构建的模型有更高的准确率和可靠性,这为住院时长的预测研究提供了参考。在对住院时长分布的研究方面,本文提出了用GMM拟合患者住院时长分布的方法,有效的解决了以往传统单一分布拟合效果不好的问题;在对住院时长预测方面,本文将XGBoost算法引入,建立了基于XGBoost算法的预测模型,展现了影响住院时长的特征变量,预测效果比起以往传统的预测模型也有一定的提升。