论文部分内容阅读
目的:了解甘肃省发热呼吸道症候群病原阳性病例的分布特征与病原检出情况,揭示主要病原的流行规律,明确高危人群与高峰季节;基于机器学习算法构建分类模型,初步判定甘肃省发热呼吸道症候群病例的病原感染类型,为呼吸道传染病流行高峰期的早期诊疗、病原监测与防控提供理论参考。方法:收集甘肃省2012年1月至2018年11月发热呼吸道症候群监测信息,采用观察性研究的方法描述病毒、细菌与病毒细菌混合阳性病例的分布特征,寻找核心病原谱,了解主要病原及其在不同人群与时间的分布规律。结合病例人口统计学资料、症状体征与实验室检测数据,通过多种机器学习分类模型对病例感染情况进行预判,比较、评估并筛选理想模型。结果:1.甘肃省发热呼吸道症候群病原阳性率、病毒阳性率、细菌阳性率与病毒细菌混合阳性率依次为38.32%、17.97%、19.36%与7.42%。病毒、细菌与混合阳性病例均表现为男性多于女性。病毒在5岁以下儿童(24.32%)与5~17岁青少年(22.81%)中阳性率较高;细菌在18岁~、45岁~与65岁~组的阳性率都在25.00%左右;病毒细菌混合感染中老年人阳性率较高(12.64%)。2.病毒谱的前三位依次为人流感病毒、鼻病毒与呼吸道合胞病毒。人流感病毒在5岁~组阳性率较高,流行于1~3月与12月;鼻病毒在18岁~与65岁~组阳性率较高,3~5月与8~11月为季节高峰;呼吸道合胞病毒在0岁~组阳性率较高,1~2月与11~12月为流行高峰。3.监测的呼吸道细菌以肺炎链球菌与流感嗜血杆菌为主。肺炎链球菌在各年龄段人群中检出水平接近,1~2月与10~11月为季节高峰;流感嗜血杆菌以5岁~组阳性率较高,流行于2月与8~10月。4.优化模型参数,决策树(DT)以使用boosting算法迭代10次、修剪纯度为70%的C5.0算法分类准确率较高;支持向量机(SVM)选择gamma值0.1、惩罚参数C为64的径向基核函数(RBF)时的准确率较高;分类回归树与RBF-SVM结合的支持向量机决策树(SVMDT)分类准确率较高。5.对比并评估模型分类效果,C5.0决策树、RBF-SVM与SVMDT的准确率分别为78.67%、76.92%与79.20%,Kappa系数分别为0.708、0.684与0.717。结论:1.甘肃省发热呼吸道症候群病原阳性病例男性多于女性。应注意未成年人病毒感染与老年人病毒细菌混合感染的防控。2.甘肃省发热呼吸道症候群主要病原有人流感病毒、鼻病毒、呼吸道合胞病毒、肺炎链球菌与流感嗜血杆菌等,不同病原在各年龄段人群中分布有所差异。总体上病毒在冬春季高发,细菌在秋冬季高发。3.SVMDT组合模型的分类效果稍优于DT与SVM,可为初步估计甘肃省发热呼吸道症候群病例病原感染情况、及时防控急性呼吸道传染病暴发提供新思路。