论文部分内容阅读
科学技术的发展,使得高维数据大量出现,例如基因表达谱数据、单核苷酸多态性数据、网上消费品价格数据、股票数据等(见Lam and Yao(2012)、Chang etal.(2015)等文献).高维数据的出现,对一些传统的多元统计分析方法和理论(如假设检验)来说是一个挑战.高维数据的一个重要特征是数据维数p远远超过样本量n,此时传统的假设检验理论是失效的,因为传统的假设检验理论是在假定p小于n的基础上建立起来的,这就需要我们更新或改写传统的假设检验理论.在多元统计分析中,均值向量和协方差矩阵是两个基本的参数,可以用它们刻画总体分布的特征.对总体均值向量和协方差矩阵的结构的研究是现在比较热门的研究方向,本文主要关注的是以下三方面涉及总体均值向量和协方差矩阵的假设检验问题.首先,我们将同时检验单个高维总体的均值向量和协方差矩阵分别等于给定的向量和给定的对称正定矩阵.我们提出一个新的检验方法,这种方法适用于“大p小n”,而且对非正态总体也是稳健的.我们推导得到新提出的检验统计量的渐近原分布,并且精确推导得出渐近理论势函数.此外,本文中我们也研究了新的检验方法的局部势,证明了新提出的检验统计量是渐近无偏的.最后我们利用模拟试验来评价新的检验方法的效果.其次,我们为同时检验一个高维总体的均值向量和协方差矩阵分别等于另一个高维总体的均值向量和协方差矩阵提出一个新的方法.这种检验方法适用于“大p小n”,不仅适用于正态总体也适用于非正态总体.我们推导得到新提出的检验统计量的渐近原分布,并且推导得出渐近理论势函数.最后我们利用模拟试验来评价新的检验方法的效果.最后,我们为检验高维总体的协方差矩阵的组内等相关结构提出一个新的方法,这种检验方法对正态和非正态总体都是有效的.在p和n成比例增加的情况下,基于鞅差中心极限定理,我们推导得出新的检验统计量的渐近正态性及相合性.最后我们利用模拟试验来评价新的检验方法的效果.