论文部分内容阅读
尿路感染是当今老龄化时代的一种常见疾病。随着年龄的增长,该疾病的患病风险也随之提高;特别是老年人或者行动不便的人群,由于其身体的健康等原因,比其他人群更容易罹患尿路感染疾病。目前,医院对于尿路感染疾病的检测方式,特别是针对老年人或者身体有一定行动能力限制的人群,主要是通过常规尿检或者导尿管取尿的方式来进行的。考虑到上述易感染人群行动不便、导尿管容易增加尿路感染疾病风险等因素,论文作者所在实验室开发了一套智能化可嵌入尿不湿的即时尿检设备系统,可以有效解决老年人或者行动能力受限制的人的尿液样本收集与即时检验。本论文的研究工作是该智能化尿检系统课题研究的一部分,并且基于该系统进行建模与实验验证。该智能尿检化系统包含了对五种尿液生物指标物(包括血液红细胞、亚硝酸盐、葡萄糖、白细胞和蛋白质)的比色法检测。在利用尿检设备对尿液进行取样以及即时检验后,利用智能手机摄像头采集尿检比色结果图片并对图像进行了颜色还原处理;然后利用MATLAB软件,分别读取结果图片的固定像素的RGB通道值作为生物指标物的特征向量。然后利用K近邻模型分别对这五种生物指标物进行分类研究,并与支持向量机、随机森林、CART决策树等对照模型进行了实验对比分析,结果表明K近邻模型相较适合于该五种尿液生物指标物数据集的分类。在分析并得到五种生物指标物的分类结果之后,形成了一份新的以五种生物指标物的分类结果为特征的数据集。由于该数据集中患病和健康两个类别样本数量的不均衡性,本文利用代价敏感学习方法改进了梯度提升决策树模型,并利用该模型预测病人是否罹患尿路感染疾病。本文应用梯度提升决策树、随机森林、支持向量机以及朴素贝叶斯模型,分别对建模时长、置信区间、混淆矩阵以及ROC曲线面积等维度与改进梯度提升决策树模型进行了综合比较分析,结果证明改进梯度提升决策树模型针对该数据集的预测性能是最优的,其对尿路感染疾病的预测的准确率达到了94.7%,且相较于原梯度提升决策树模型预测准确率提高了约3%。该模型将应用于智能化尿检系统的软件设备中,有助于实现尿路感染相关疾病的快速诊断。