论文部分内容阅读
目的:明确多种衰弱筛查工具在养老机构老年人中的测量性能,以老年综合评估(Comprehensive Geriatric Assessment CGA)为衰弱诊断金标准,从衰弱本身概念出发,在养老机构老年人中评价并比较不同衰弱筛查工具的诊断性能,同时比较不同衰弱工具对养老机构老年人不良健康结局的预测效度,为机构老年人提供适宜的衰弱筛查工具,以早期识别有较高不良结局风险的老年人。方法:采用便利抽样方式,选取济南市309名养老机构老年人为研究对象。分别采用衰弱身体表型(Physical Frailty Phenotype,PFP)、FRAIL量表(Fatigue,Resistance,Ambulation,Illnesses,and Loss of weight,FRAIL)、SOF 指数(the Study of Osteoporotic Fracture,SOF)、蒂尔堡衰弱指标(Tilburg Frailty Indicator,TFI)、格罗宁根衰弱指标(Groningen Frailty Indicator,GFI)和衰弱指数(Frailty Index,FI)对机构老年人进行衰弱评估,以CGA为衰弱诊断金标准。以机构老年人失能(Activities of Daily Living,ADL)、跌倒及住院发生情况作为不良健康结局。采用受试者工作特征(Receiver Operating Characteristics,ROC)曲线描述不同衰弱筛查工具对机构老年人衰弱的诊断准确性,计算相应的曲线下面积(Area Under the Curve,AUC)和 95%可信区间(Confidence Interval,CI),并检验不同衰弱筛查工具间的AUC是否存在差异;根据Youden指数(Youden Index,YI=灵敏度+特异度-1)最大原则确定各衰弱工具的最佳临界值,并分别计算六种衰弱工具在原始临界值和最佳临界值时的灵敏度、特异度、阳性预测值(Positive Predictive Value,PPV)、阴性预测值(Negative Predictive Value,NPV)、正确分类率(Correctly Classified Rate,CCR)和 Kappa值等诊断性能指标。采用多因素Logistic回归分析检验每一种衰弱工具定义的衰弱与不良健康结局间的关系,均控制了年龄、性别、婚姻状况及文化程度等协变量,结果以比值比(Odds Ratio.OR)和95%CI呈现;采用ROC曲线评估并比较衰弱工具对机构老年人不良健康结局的预测能力。统计分析采用SPSS 21.0、Stata 12.0软件包,P<0.05认为有统计学意义。结果:1.不同衰弱筛查工具评估的机构老年人的衰弱发生率分别为20.1%(SOF)、25.6%(FRAIL)、41.7%(PFP)、45.3%(TFI)、56.3%(GFI)、79.6%(FI)。CGA诊断的衰弱发生率为74.1%。2.以CGA为衰弱诊断金标准,不同衰弱筛查工具的AUC分别为0.77[95%CI = 0.71-0.82:SOF]、0.79(95%CI = 0.74-0.85:FRAIL)、、0.80(95%CI =0.75-0.85:TFI)、、0.80(95%CI = 0.75-0.86:GFI)、、0.83(95%CI = 0.78-0.88:PFP)和0.89(95%CI=0.85-0.93:FI)。在原始临界值时,FI的灵敏度较高(92.1%)但特异度较低(56.3%),而其它5种衰弱工具的灵敏度较低(26.2%-69.0%)但特异度较高(80.0%-97.5%);6种衰弱工具的PPV均较高(85.8%-93.8%),但NPV均偏低(31.6%-71.4%);另外,6种衰弱工具识别衰弱的CCR为44.7%(SOF)-82.9%(FI),且与CGA间一致性程度的变化范围较大(kappa:0.141-0.520)。在最佳临界值时,PFP、FRAIL、SOF和FI的灵敏度和特异度间更加均衡,且其相应的CCR(66.7%-83.2%)和kappa值(0.362-0.597)均有所增加,但是仍表现为PPV较高、NPV较低。以CGA为金标准比较不同衰弱筛查工具的AUC结果显示,F1对衰弱的诊断性能优于 PFP(χ2=6.09,P<0.05),TFI(χ2=12.43,P<0.05),GFI(χ2=12.85,P<0.05),FRAIL(χ2=13.04,P<0.05)和SOF(χ2=18.92,P<0.05);PFP的诊断性能优于SOF(χ2=6.36,P<0.05);其它几种衰弱工具间AUC的差异无统计学意义。3.Logistic回归分析显示,控制年龄、性别、婚姻状况和文化程度后,在原始临界值时,6种衰弱筛查工具均可独立预测ADL失能(OR:3.29-30.23,P<0.05);仅PFP、FRAIL、SOF及FI定义的衰弱与跌倒相关(OR:1.96-2.76,P<0.05);而所有衰弱工具定义的衰弱均不可显著预测机构老年人的住院情况(OR:0.72-1.29,P>0.05)。在最佳临界值时,除PFP定义的衰弱不再与跌倒相关(OR=1.76,95%CI=0.94-3.41)外,6种衰弱工具对ADL失能、跌倒和住院的预测效度与原始临界值时结果相似。分别以ADL失能、跌倒和住院为效标,进行ROC分析结果显示,6种衰弱筛查工具对ADL失能的预测能力中等(AUC:0.73-0.88),FI的AUC大于其它衰弱工具的AUC(χ2:18.15-32.52,P<0.001);衰弱工具对跌倒的预测能力较低(AUC:0.57-0.62),且各衰弱工具间AUC的差异无统计学意义(χ2:0.01-2.18,P>0.05);FRAIL、SOF和GFI对住院的预测能力较低(AUC:0.51-0.53),PFP、TFI和FI不能有效预测机构老年人住院情况(AUC<0.50)。结论:机构老年人中衰弱发生率较高,不同衰弱筛查工具评估的衰弱发生率变化范围较大,多维衰弱工具评估的衰弱发生率高于单维衰弱工具。以CGA为衰弱诊断金标准,各衰弱筛查工具均具有良好的诊断性能,FI对衰弱的诊断性能优于其它衰弱工具,但是衰弱工具的灵敏度和特异度间存在权衡关系,总体表现为灵敏度和阴性预测值较低,但特异度和阳性预测值较高。六种衰弱筛查工具均可预测机构老年人失能,且预测能力呈中等;FRAIL、PFP、SOF及FI可以识别出跌倒发生风险较高的老年人,但预测能力不充分;六种衰弱筛查工具均不可预测机构老年人住院情况。