论文部分内容阅读
计数数据在很多领域(如生物医药,公共卫生等)都有着很重要的应用,为了分析这类数据,许多研究者采用了形式简单的泊松分布,但是泊松分布均值等于方差的严苛要求又是很多实际数据所不能满足的。此外,实际应用中我们经常遇到这样一类数据,其中包含大量的零,此时,利用泊松分布处理该数据可能并不理想。于是,在泊松分布中引入离差参数,并与零退化分布混合所得的零过多广义泊松分布将是处理这类数据的一个不错的选择。本文旨在为一批医护使用数据选取一个较合适的模型,该数据中记录了来自48个家庭180个个体连续6年中对某医疗设施的使用次数以及每个个体的一些基本情况。由于数据是来自不同家庭,不同成员的多次观测结果,我们将模型定位于三层回归模型。文中我们首先讨论了最复杂的多层零过多广义泊松回归模型的参数估计方法,应用EM算法求解出参数的约束极大似然估计。然后,研究了回归模型中零过多(ZI)参数以及离差参数的显著性检验,得到了score检验统计量。另外,文中还利用大量的随机模拟方法研究了我们给出的参数估计方法和score检验统计量的有效性。最后,我们结合score检验,似然比检验等手段进行模型选择,为医护数据寻找到较合适的模型。同时,求解了负对数似然,偏差等统计量以及模型比较得分准则,用以说明模型选择的合理性。根据最终选择的模型,对数据进行拟合,所得到的结论基本合理,并且与人们一般的认知保持一致,这也进一步说明了我们参数估计和假设检验方法的有效性。