论文部分内容阅读
研究背景:对于生存资料的Meta分析,最理想的做法是搜集IPD(Individual Patient Data,IPD)原始数据,将各个研究的原始数据合并后再进行生存分析,进而计算试验组相对于对照组的HR值及其可信区间以及各组中位生存时间等信息,这种方法是生存资料meta分析的金标准。然而,在文献检索过程中,通过公开发表的文献全文报道以及摘要信息资料一般很难得到病人的原始数据信息。在无法获得原始数据的情况下,目前被广泛应用的方法是将HR(Hazard ratio, HR)的对数值作为效应量进行生存资料的meta分析,进而得到合并效应量(合并的HR值)及可信区间,称为AD(Aggregated data)meta。这种情况下AD meta分析的结局指标仅为合并的HR信息,目前在生存资料的AD meta分析中尚没有研究提供相应试验组和对照组合并的中位生存时间的信息。然而,当合并的HR用于描述临床试验治疗结果时,其反映的仅仅是试验组与对照组相比终点事件发生风险相对大小,指标解读相对抽象,研究者通常还关心治疗方法能在多大程度上延长生存时间。然而HR值并不能直接地描绘出疾病改善的程度及获益时间,导致信息解释不充分,需要提供更加直观的指标解释临床获益。另外,当个研究合并的HR结果近似时,其研究总体所对应的生存曲线及中位生存时间可能并不相同。基于以上原因,中位生存时间能够补充HR合并值不能提供的信息,能够提供治疗方法在多大程度上延长生存时间,能够更直观地描绘治疗给疾病带来的获益。进而,丰富生存资料meta分析提供的结果信息,具有理论意义及实际应用价值。研究目的:本研究针对生存资料AD meta分析中HR合并值在提供信息上存在的不足,构建meta分析中位生存时间合并的统计学模型和算法,并对构建模型的分析结果进行验证和评价,解决循证医学临床实践中遇到的实际问题,并将所建立的模型应用到真实数据的生存资料meta分析中,检验效果,推广应用。研究方法:根据meta分析效应量合并的方法以及生存资料数据的特点,对生存时间数据进行对数转换,使其正态化,构建生存时间效应量。再根据生存资料AD meta分析HR合并的方法和特点以lnHR的标准误构建时间效应量的标准误,从而构建HR可信区间加权法模型;在HR可信区间信息无法获得的情况下,以事件数和样本量信息作为加权因子,构建事件数加权法模型。通过SAS软件对独立生存分析研究的个体病人分别模拟病人的编号、组别、生存时间及生存结局等变量数据。在各个独立研究中对个体数据计算出独立研究的合并效应量;根据模拟的原始数据和计算出来的合并效应量进行meta分析,得到IPD资料的meta分析结果和只有HR相关信息的AD meta分析合并结果。根据模拟的IPD资料计算中位生存时间并作为金标准。根据合并的单独研究的HR值及其95%可信区间,和中位生存时间的数据,用HR可信区间(confidence interval, CI)及事件数及样本量信息作为加权因子用倒方差法(generic inverse variance)进行合并,得到中位生存时间合并数据,探索不同方法对生存资料meta分析中位生存时间合并结果的影响。对不同方法合并得到的中位生存时间与IPD数据得到的中位生存时间金标准结果用相关系数法、Bland-Altman以及ATE/LER(Allowable Total Error and Limits forErroneous Results)方法进行一致性评价,并对不同的合并方法的优劣进行比较。将所建立的模型应用到实际生存资料meta分析中,为meta分析提供中位生存时间的信息。研究结果:(1)模拟数据集情况:本研究模拟的生存时间数据的分布为指数分布。模拟单独研究的原始数据信息包括分组变量、病例编号、生存时间、生存结局等变量。将原始数据进行了两个维度的预处理,得到如下两部分数据集:1)根据单独研究的原始数据计算每个独立研究的文献报道变量风险比(HR)、HR的95%可信区间、试验组和对照组的中位生存时间、试验组和对照组的样本量及发生的事件数,将由每个单独研究计算得到的这些信息合并为meta分析的初始数据集,并且用这些变量构建中位生存时间估算的模型。2)将单独研究的原始数据合并,构建meta分析原始数据集,即IPD数据集,对IPD数据进行生存分析,得到HR值及其95%可信区间,两组中位生存时间,两组事件数等信息,这些信息作为生存资料meta分析的金标准,主要用于与模型计算所得的中位生存时间估算值进行一致性比较,评价模型的优劣。本研究的模拟数据共有5种不同情况:分别为M20S500, M10S500, M10S200,M5S400, M5S200(M代表meta分析;M后的数字代表meta分析中纳入的研究数;S代表研究;S后的数字代表每个研究中纳入的病例数;每个meta分析实际包含的原始病例数为纳入研究数与病例数的乘积)。即由模拟数据得到每个meta分析中共由20个、10个或5个独立的研究(study)组成,每个独立的研究分别由500例、400例或200例病例组成,其中试验组与对照组样本量相等。即每个meta分析研究共由10000例、5000例、2000例或1000例个体病例组成。每个IPD meta所包含的病例数也分别为10000例、5000例、2000例或1000例。本研究中对每种情况模拟具有共同研究目的的meta分析研究共500个,对于每一套meta分析模拟数据得到500对试验组和对照组中位生存时间的数据。(2)模型的构建:本研究根据meta分析加权平均的思想,将中位生存时间数据进行对数转换,得到近似正态分布的效应量,分别由HR的可信区间以及试验组和对照组事件发生数以及样本量的信息推算效应量的抽样误差因子进行加权。构建两种不同的加权模型,两种抽样误差因子分别为:由前者进行加权的方法定义为HR可信区间加权法,后者定义为事件数加权法。(3)两种模型计算出来的中位生存时间与金标准的一致性评价:将单个meta分析模拟数据所得的合并中位生存时间与金标准进行一致性评价,评价方法为相关系数法、Bland-Altman法以及ATE/LER法。结果:1)HR可信区间加权法:针对M20S500数据进行一致性评价,模型中位生存时间估算值与金标准的相关系数为0.99, P<0.001,中位生存时间估算值与金标准之间存在正相关关系;Bland-Altman方法分析中位生存时间估算值与金标准之间差值d的95%可信区间为-1.2744~1.6390; ATE/LER法在假定临床界值Mc=2的情况下,用估算值(y轴)与金标准(x轴)绘制散点图,在Y=X±2直线之内的散点占所有散点的百分比为99.3%。对M10S500,M10S200,M5S400,M5S200等其余四种模拟数据的一致性检验结果与M20S500模拟数据结果类似,估算值与金标准相关系数均在0.99以上,Bland-Altman检验方法中位生存时间估算值与金标准之间差值d的95%可信区间较窄,ATE/LER法在假定临床界值Mc=2的情况下,在Y=X±2直线之内的散点占所有散点的百分比在86.4%以上;2)对于事件数加权法:对M20S500数据进行一致性评价,结果模型中位生存时间估算值与金标准的相关系数为0.99, P<0.001,认为中位生存时间估算值与金标准之间存在正相关关系;Bland-Altman方法分析发现中位生存时间估算值与金标准之间差值d的95%可信区间为-2.1571~1.5818; ATE/LER法在假定临床界值Mc=2的情况下,用估算值(y轴)与金标准(x轴)绘制散点图,在Y=X±2直线之内的散点占所有散点的百分比为98.7%。对M10S500,M10S200,M5S400,M5S200其余四个模拟数据的一致性检验结果与M20S500模拟数据结果类似,估算值与金标准相关系数均在0.99以上,Bland-Altman方法中位生存时间估算值与金标准之间差值d的95%可信区间在也较窄,ATE/LER法在假定临床界值Mc=2的情况下,在Y=X±2直线之内的散点占所有散点的百分比在78.6%及其以上;两法比较结果表明HR可信区间加权法比事件数加权法优,估算值与金标准的一致性较好。(4)实例应用:本实例研究共纳入9项肺癌维持治疗的临床研究,共纳入病人数6,655例。研究所涉及到的小分子生长因子受体酪氨酸酶抑制剂类药物为吉非替尼(gefitinib)和厄尔替尼(elotinib),维持治疗的给药方式为持续维持治疗和序贯维持治疗。研究结果:1)在持续维持治疗中小分子生长因子受体酪氨酸酶抑制剂类药物不能提高病人的总体生存期(overall survival,OS),,HR=1.05,95%CI0.98~1.14,p=0.186。差别无统计学意义,无异质性(p=0.938;I2=0%)。该类药物同样不能提高病人的无疾病进展生存期(progression free survival, PFS), HR=0.88,95%CI为0.74~1.05,p=0.165,结果无统计学意义。然而,纳入的研究中存在异质性,异质性检验的p=0.0001,I2=84.4%。异质性分析结果,无疾病进展期数据异质性主要存在于Mok等进行的研究,该项研究在一线给药时厄尔替尼与化疗药是交替给予的。在敏感性分析中剔除该研究发现异质性降低,p=0.716,I2为0%。合并的HR值为0.98。中位时间的合并结果为,在持续维持治疗中,试验组合并的中位生存时间为10.24月,对照组合并中位生存时间为10.55月;试验组合并的中位疾病进展时间为5.36月,对照组为5.18月。2)在序贯维持治疗中,小分子生长因子受体酪氨酸酶抑制剂类药物能够提高病人的总生存期,合并OS的HR为0.87,95%CI为0.80~0.95,p=0.001,差别具有统计学意义,且无异质性(p=0.660;I2=0%)。进一步的亚族分析发现,序贯维持治疗在女性(0.73,0.59~0.91;p=0.005)、亚洲人群(0.62,0.42~0.92;p=0.02)、非吸烟者(0.70,0.50~0.98;p=0.04)、腺癌病人(0.84,0.72~0.99; p=0.03)、具有EGFR突变的病人(0.47,0.24~0.90;p=0.02)、以及具有稳定病情的病人(0.76。0.64~0.89。 p=0.0009)中具有较好的效果。交互检验结果小分子生长因子受体酪氨酸酶抑制剂类药物在序贯维持治疗中对总生存期的提高效果高于持续维持治疗对总生存期的影响(0.87vs1.05;交互检验p=0.0013)。该类药物在序贯维持治疗中能够提高病人的PFS,合并PFS的HR为0.75,95%CI为0.69~0.81,p<0.001,差别具有统计学意义,且无异质性(p=0.206;I2=34.3%)。敏感性分析去除Miller的研究结果与不剔除相比是一致的。亚族分析发现,序贯维持治疗在女性(0.67,0.58~0.79p<0.0001),亚洲人群(0.50,0.34~0.74;p=0.0005),非吸烟人群(0.74,0.62~0.88; p=0.0005),腺癌病人(0.70,0.62~0.78; p<0.0001)效果较好。交互比较发现小分子生长因子受体酪氨酸酶抑制剂类药物在序贯维持治疗与持续维持治疗时对PFS的提高差别不具有统计学意义(0.75vs0.88;交互检验p=0.104)。但是当剔除Mok研究发现这两种治疗方式对PFS的作用有所不同,交互检验发现序贯治疗对PFS的作用高于持续维持治疗(0.75vs0.98;交互检验p<0.0001)。中位时间合并结果为:试验组和对照组合并中位生存期分别为12.18和11.43个月;合并中位无疾病进展期分别为3.22和2.42个月。研究结论:本研究根据生存资料AD meta分析原理及中位生存时间与HR合并值关系,推算中位生存时间效应量以及效应量的标准误,进而构建了生存资料meta分析中位生存时间合并的统计学模型。为生存资料AD meta提供合并中位生存时间的信息,理论依据充分,且具有实际应用价值,填补了传统方法的不足。本研究针对生存资料数据特点进行模拟,模拟指数分布原始生存分析数据,进行发表文献结果的模拟以及IPD数据的模拟。并且根据实际情况模拟具有不同研究数和样本量的数据对模型进行充分检验,结果表明本研究建立的模型可靠。研究表明,用HR的可信区间加权法以及事件数加权法两种方法计算得到的中位生存时间估计值与金标准值的一致性都较好;用HR可信区间法加权得到的中位生存时间估计值与金标准值的一致性更好。说明上述两种方法进行中位生存时间的合并都具有合理性,在能够得到HR可信区间的前提下用HR可信区间法得到的中位生存时间更接近真实值,这种方法更好。小分子生长因子受体酪氨酸酶抑制剂类药物在序贯维持治疗中能够提高非小细胞肺癌病人的总生存期和无疾病进展生存期,在某些特定的人群中效果更佳。提示在应用该类药物进行维持治疗时应注意给药方式和敏感人群的选择。