论文部分内容阅读
背景 糖尿病视网膜病变(diabetic?retinopathy,DR)是糖尿病患者主要并发症之一,其病程进行性发展可致视功能损伤甚至失明.探索影响DR进展的临床因素对糖尿病患者预防、控制和管理DR具有重要意义.目的 通过机器学习算法和沙普利可加性特征解释方法(SHAP)分析探讨2型糖尿病患者并发DR的风险因素.方法 回顾性分析“国家人口与健康科学数据共享平台”公布的“解放军总医院糖尿病并发症预警数据集”3000例2型糖尿病患者的临床资料,对58项观察变量在无DR并发症(non?diabetic?retinopathy,NDR)患者和并发DR患者两组组间进行基线分析以及差异性检验;评判XGBoost、随机森林、logistic回归三种机器学习算法,采用递归特征消除(RFE)和XGBoost机器学习算法选取最优模型预测变量,并对变量特征权重值排序;应用SHAP方法对模型的风险因子进行解释分析.结果 DR组的高血压症(收缩压/舒张压)、糖化血红蛋白、血脂水平(总胆固醇、低密度脂蛋白)、脑卒中、肾病(血尿素、血肌酐、血尿酸)、肾衰、下肢动脉病变等并发比例或指标水平高于NDR组(P??5?mmol/L时DR风险显著升高.结论 XGBoost算法和SHAP模型可用于预测糖尿病患者DR的风险因素及解释特征变量交互关系,提示糖化血红蛋白、合并肾病、血尿素水平对DR这一2型糖尿病微血管并发症的高风险预测性.