论文部分内容阅读
本文主要内容是用病例-对照研究的方法探索患病情况(响应变量)和风险因素(协变量)之间的关系.病例-对照研究又叫回顾性研究,首先研究人员在病例组和对照组中抽取独立随机的样本,然后调查样本的协变量,用这些数据建立预测模型.在选取研究对象时,为节省资源,研究人员通常用分层二阶段抽样代替简单抽样.比如有些协变量花费较少就可以得到它们的信息,在第一阶段,我们可以调查每个研究对象的这些协变量,然后根据这些协变量的信息进行分层.在第二阶段,从每一层抽取少量的子样本,再调查子样本的其它较昂贵的信息.在进行病例-对照研究时,logistic回归模型是被普遍采用的模型,因为logistic回归模型可以用回顾性数据来研究前瞻性模型,这一特性是其它模型所不具有的.
最初研究人员选取独立个体为研究对象,个体之间没有任何关系;后来考虑到某些疾病具有一定的遗传因素,即患病风险在家庭(族)内部具有一定的相关关系,因此在进行统计分析时,研究人员往往搜集来自家庭(族)内部的信息,将一个家庭的数据放在一起,并在模型中加入来自家庭的随机效应,来研究成员之间的联系以及响应变量和遗传因素之间的关系.
事实上,像癌症或其它一些流行病的病情是分级别且有序的,如:无病、较轻、严重、很严重等等,本文着重对多项且有序响应变量的病例-对照家庭数据进行统计分析.引入分层抽样的方法,给出了在分层抽样样本下的偏似然分析方法,并证明了所给分析方法与原抽样方案下似然方法的等价性,从而避免了协变量的边际分布.最后,用模拟的方法考察了所得参数估计在有限样本下的效果.