论文部分内容阅读
ROC曲线以共同的、容易解释的尺度,对诊断系统的准确性提供了直观的视觉印象,是不同阈值对应的灵敏度与特异度的折中体现;其曲线下面积描述了诊断系统对正反两种状态的判别能力。目前,ROC分析被公认为衡量诊断信息和诊断决策质量的最佳方法,其方法和应用的研究在生物统计学、临床流行病学、放射学、决策学、实验室医学等领域十分活跃。本文对该方法的研究历史和现状作了系统的归纳;在已有文献的基础上,结合医学研究中的具体实例和需要解决的具体问题,探讨了ROC分析的多种方法;比较了各种方法的优缺点及其应用条件;并自编了大量SAS程序。 本文采用双正态模型、有序回归模型等参数法,Cox比例风险模型半参数法,Hanley、Delong非参数法拟合了ROC曲线;文中也考虑了样本量的估计、协变量的混杂效应、再抽样技术计算ROC曲线下面积的标准误与可信区间等问题;并研究了SROC分析方法。具体工作与结果小结如下。 1.双正态模型假定正常组与异常组均服从正态分布。目前该模型用于ROC分析的统计学方法比较完善,属于“经典”的ROC分析参数法。本文探讨了单变量、双变量双正态ROC模型的构建及其参数的最大似然估计方法;采用双变量卡方检验、真阳性率z检验、面积z检验三种方法比较了ROC曲线间是否具有显著性差异。用真双正态模型处理了退化资料。采用ROCKIT等软件对单个有序分类资料、单个连续性资料、多个相关或独立的有序分类资料、多个相关或独立的连续性资料、不完全缺失资料、多观察者多诊断方式的重复有序分类资料等进行了分析。 2.非参数法主要有Hardey和McNeil法与Delong,Delong和Clarke-Pearson法两种,这两种方法均得到了大家的公认,属于“经典”的ROC分析非参数法。它们对正常组与异常组的分布没有要求;可充分利用所有截断点,对连续性样本量大小没有限制;不会类似参数法出现不能获得计算结果的情况;如果双正态模型迭代不收敛,不能获得参数估计值,或对于大型连续性资料,常可用非参数法代替参数模型建立ROC曲线。非参数法中Hanley和McNeil法计算相对简单,容易理解,适用于一般独立的有序分类资料与连续性资料。对于该方法,我们编写了SAS程序。目前有很多计算机软件采用了这种方法,如SPSS 9.0以上Windows版,能很容易实现这种方法。Delong,Delong和Clarke-Pearson法计算获得的ROC曲线下面积与Hanley和McNeil法完全相同,它们均等价于梯形法。尽管Delong,Delong和Clarke-Pearson法计算比较复杂,但该方法与Jackknife法类似,且获得的方差协方差满足了相关ROC资料比较的需要。 3.本研究除探讨了以上ROC分析方法外,还探讨了有序回归模型(比例优势模型、位置尺度模型、GEE法)、Cox比例风险模型获得ROC曲线、曲线下面积及其标准误的方法。也采用这些方法初步考虑了协变量的混杂效应问题。