偏差数据下的半参数模型研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ghosty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生存分析已经发展成为生物统计学最主要的领域之一,它在其他领域也有很重要的应用,包括可靠性理论,精算学,人口统计学,流行病学,社会学和经济学.由于抽样的复杂性,我们得到的实际数据大部分是有偏差的,例如,常见的删失数据和截断数据,它们都可被看作是一般偏差数据.当然,偏差数据也出现在许多其它领域中,例如生物医学,社会学,经济学,质量控制学等.当个体被抽样的概率取决于它本身的取值,即每个个体被抽样的概率不同时,所得到的数据为偏差数据.这是一个有趣的抽样问题,因为它偏好某一些个体而忽略另外一些个体.当收集到的数据是偏差数据时,原先关于简单数据的统计推断程序已经不再适用,我们必须寻找针对偏差数据的方法.本文用估计方程的方法来研究一般偏差数据下的半参数模型,因为半参数模型既含有易于解释的有限维参数,又含有增加模型灵活性的无限维未知函数.在本文的第一章,我们首先介绍要研究的几种偏差数据类型,即删失数据,长度偏差数据和病例队列设计下收集到的数据.然后介绍要研究的几种生存分析中常见的半参数模型,即Cox模型,加性风险模型,半参线性转移模型,分位数回归模型和比例均值剩余寿命模型.在本文的第二章,我们利用长度偏差数据的一个重要性质,即截断时间与登记后剩余时间具有相同的分布(Huang&Qin,2011,2012),来构造加性风险模型下的复合估计量,由此得到估计量的效率是原来左截断右删失估计量效率的二倍左右.我们和Cheng&Huang(2014)几乎同时最先利用复合估计方程这个概念.所得到估计量的大样本性质和有限样本下的随机模拟结果也将在本章中展示,同时我们将所提出的方法应用到美国Channing House数据上,发现效果很好.在本文的第三章,我们利用一般左截断右删失数据的鞅结构和第二章中介绍的长度偏差数据的重要特性,提出了长度偏差数据下分位数回归模型的简单估计方程方法和复合估计方程方法.我们的方法并不需要估计删失变量的分布.因而跟Chen&Zhou(2012)和Wang&Wang(2014)比起来,我们的方法减少了复杂度.我们通过经验过程和随机积分技巧建立了渐近性质,包括一致相合性和弱收敛性.和Peng&Huang(2008)类似,通过最小化一系列L1型的凸函数来得到简单的算法.新的估计方法可以简单的利用R语言中现有的函数.当估计方差时,由于极限方差中含有未知的密度函数,这在有限样本下的估计量是很不稳定的,所以我们通过推广Jin et al.(2001)的方法来估计方差.最后,我们将所提出的方法应用到美国Channing House数据上.在本文的第四章,我们研究删失数据在病例队列设计下的比例均值剩余寿命模型.由南威尔士州一个镍炼油厂的实际数据驱动,这里我们想知道镍矿工人在现有的各种协变量下他还能活多久.而且这项研究的发病率很低,因此优先选择病例队列设计.通过提出加权估计方程来对回归参数和基本均值剩余寿命函数进行估计,并给出所提出估计量的大样本性质.然后,我们给出随机模拟结果来检验所提出方法在有限样本下的表现.最后,通过分析上面提到的南威尔士州镍炼油厂的实际数据来说明我们所提出的方法.在本文的第五章,我们研究长度偏差数据在病例队列设计下的Cox模型.受Self&Prentice(1988)提出的伪似然方法和Huang&Qin(2012)提出的复合部分似然方法的启发,我们提出一个简单的复合伪部分似然方法.通过经验过程和无放回抽样收敛结果,我们也给出了病例设计下极大复合伪似然估计量和相应累积风险率函数的大样本性质.我们也展示了随机模拟实验结果,并用奥斯卡数据来说明所提出的估计方法.在本文的第六章,我们讨论了长度偏差数据在病例队列设计下的半参线性转移模型Lu&Tsaitis(2006)应用的是鞅积分表示和逆概率加权方法来处理右删失数据在病例队列设计下的半参线性转移模型.即使我们可以利用鞅积分表示来处理左截断,所得到的估计量在长度偏差抽样下并不是全有效的.我们继续利用第二章中提到的长度偏差数据的重要性质和逆概率加权方法来构造复合估计方程.所得到的估计方程可以利用简单的迭代算法来估计回归参数和未知的转移函数.我们给出了所提出估计量的渐近分布结果和它们的证明.通过展示随机模拟结果和一个实际例子分析来检验所提出的回归参数估计量在有限样本下的表现.
其他文献
目的:探讨冠状动脉CT成像技术在冠心病诊断中的临床价值。方法选取136例冠心病患者作为研究对象,患者均采用CT诊断及冠脉造影检查,对其影像诊断结果进行观察分析,观察诊断特异性
<正>一、教师在高中英语教学中实施探究性学习的现状分析笔者通过对目前高中英语新课程改革背景下高中英语学科探究性学习进行实证研究,发现高中英语探究性学习存在如下问题
近三十年以来,教师知识研究"范式缺失"(Missing Paradigm)所引发的争议,以及研究者们对知识研究的重新审视与反思,使教师PCK的研究成为当前教师教育研究的焦点。文章试图从"
提高内部控制有效性是我国金融业增强竞争力的关键。本文对我国金融类上市公司内部控制有效性的现有研究成果进行了回顾与总结,发现现有内部控制有效性研究在研究对象、研究
邓小平思想政治教育理论是邓小平理论的重要组成部分。它是邓小平在马克思主义指导下,在毛泽东思想政治教育思想的基础上,对我党建党以来各个历史时期、特别是改革开放以来的
针对光伏输出功率非线性、波动大、不稳定等特征引起光伏功率短期预测不精确的问题,本文提出了一种基于相似日聚类和利用共轭梯度法(CG)改进深度信念网络(DBN)的组合模型预测
融资租赁是企业的重要筹资方式之一。然而,融资租赁筹资也存在很多缺点,比如租赁成本高,租期长,在租赁期内发生意外的可能性大等,在利用融资租赁进行筹资的风险也相应而生,所
人性问题是伦理学古老而又永恒的话题,以人性的善与恶,利己与利他的为分水岭,形成了历史上各伦理学流派。作为现代经济学的奠基者亚当·斯密,分别以利己和利他为出发点给后人
作文教学是一项综合性很强的工作,本文作者结合自身工作实际,从激发学生作文的自主精神,作文教学应以学生为本位;作文要做到观察、思维、表达密切结合;作文教学要从内容入手,
随着网络信息技术的发展、大数据时代的到来以及智能手机的普及使用,互联网与传统实体经济的融合成为大势所趋,以电子商务为代表的“互联网+”新兴经济形态逐渐引起重视。经