部分线性多指标可加模型的降维及其应用

来源 :浙江财经大学 | 被引量 : 0次 | 上传用户:qazaq1313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了基于高维纵向数据的部分线性多指标可加模型的降维问题以及该模型在医疗费用中的应用。在观测收集数据时,对同一个受测个体或受测单位,在时间顺序或者空间顺序下,重复追踪多次所观测到的数据,称该数据为纵向数据。纵向数据常出现在医学、生物学、心理学、社会学、经济学以及保险等领域中。纵向数据的研究不仅可以了解受测个体或单位随时间变化的趋势,也可以了解总体随时间变化的趋势。其本质特征是同时结合了时间序列数据和截面数据,组内数据相关而组间数据独立。对于纵向数据的分析研究有两个难点,第一个难点是要考虑同一受测个体或单位,不同次观测间的相关性。第二个难点,在考虑数据相依性的前提下,如何将已有的统计理论和方法进行改进和创新,使之适用于高维纵向数据的处理。由于高维数据的“维数灾难”特点,传统的统计方法不再适用于高维数据的处理,这给传统的统计方法带来许多的挑战与困难。在此背景下,本文研究了在高维纵向数据下的部分线性多指标可加模型的降维问题,并将该模型应用于收集到的纵向医疗费用数据中,对纵向医疗费用数据进行降维分析。本文的创新之处在于:第一,基于高维纵向数据,提出了部分线性多指标可加模型。该模型的优点是,将传统的,协变量是低维情形下的统计模型,改进成允许含有高维协变量的,连接函数未知的统计模型。第二,使用了部分充分降维的理论和方法对高维纵向数据下的部分线性多指标可加模型进行降维。第三,使用了最小平均方差估计的理论和方法对高维纵向数据下的部分线性多指标可加模型进行降维。本文还在已有的统计理论和方法的基础上,进行了改进和创新,使之适用于高维纵向数据的分析。对于部分线性多指标可加模型中高维协变量的降维处理以及连接函数的估计,本文给出了两种不同的估计方法:方法一:首先对模型中多指标部分使用部分充分降维(partially sufficient dimension reduction,PSDR),使得协变量降至低维,得到了模型降维后的部分中心子空间的结构维数和基方向。在使用部分充分降维方法后,多指标模型转化为标准的部分线性可加模型,然后利用Manzan&Zerom(2005)提出的核估计方法,估计未知的连接函数。从而实现对部分线性多指标可加模型的降维以及模型中未知连接函数的非参数估计。方法二:针对高维数据“维数灾难”以及高维纵向数据结构的复杂性,使用Xia(2002)提出的最小平均方差估计(minimum average variance estimation,MAVE),在降维的同时,对模型中未知的连接函数进行估计。从而完成对部分线性多指标可加模型的降维以及模型中未知连接函数的非参数估计。与此同时,本文也分别给出了两种方法的数值模拟和渐近性质。根据数值模拟,可以发现两种方法对高维协变量降维均有较好的估计。最后,利用一组慢性心力衰竭病人的医疗费用数据进行了实例分析。
其他文献
弦支网架结构,是由网架结构、预应力拉索、撑杆三种结构单元形成的预应力空间钢结构。这种结构不仅实现较大跨度、成就许多奇特造型,而且结构整体受力性能很佳,结构自重较轻,
供应链是企业间为了应对日益激烈的市场竞争而演化出来的一种运作模式,经济全球化将这种企业之间的竞争扩展到了供应链之间。随着企业越来越重视知识的管理,知识资源成为企业
掏挖基础由于经济、环保和较好的抗拔性能而广泛应用于输电线路基础、地下空间基础和建筑基础等工程中。降雨入渗造成土体由非饱和状态向饱和状态转变,从而使土体基质吸力减
随着光子集成器件的发展,表面等离子体技术引起了众多研究者的广泛关注。表面等离子体激元(Surface Plasmon Polaritons,SPPs)是在相对介电常数符号相反的两种介质的界面传播
随着移动互联网的发展,数据业务已成为中国移动的主营业务和主要收入来源。在目前中国移动2/3/4G多制式多网共存、同期运营的背景下,现网中存在大量4G用户的数据业务倒流承载
三维空间中现有的复合表达模型在描述目标对象之间位置关系时,无论是在认知习惯还是区分度方面尚且存在着一些缺陷,这些缺陷直接影响着空间关系推理结果的精确性。针对上述问
认知无线电技术是缓解频谱资源紧缺、提高频谱利用率的关键技术之一。然而,认知无线电网络的开放性与共享性使得它需要面对更多的安全威胁,因此保密技术显得越发重要。传统信
徐变作为水泥基材料固有的一种长期变形性能,对混凝土结构,尤其是预应力结构的影响较大,备受国内外学者的关注。目前关于矿物掺合料对水泥基材料徐变性能的影响的研究大多基
航空管件制造时由于加工工艺及材料自身应力的存在,往往造成管件端口圆度不满足要求,目前采用传统校圆的方法生产效率慢、自动化水平低并且精密度不够,因此本文采用电磁校形
传感器节点能量有限且不容易补充能量,因此网络的能量资源非常宝贵,网络的寿命成为衡量算法性能的重要指标。分簇路由算法是无线传感器网络热点研究内容之一,可以有效地均衡