论文部分内容阅读
[摘要]主要内容为带不等式约束的线型回归模型数据点的影响分析,给出不同数据点删除前后拟合值的影响定义,重点介绍若干实用的度量影响的统计量Cook统计量,W-K统计量。
[关键词]数据点的影响分析 Cook统计量 W-K统计量 拟合
中图分类号:O1-0 文献标识码:A 文章编号:1671-7597(2009)0110005-02
一、引言
影響分析是统计诊断中十分活跃的分支,其研究内容和方法近年来仍然在不断的发展和开拓。影响分析的内容大致可分为两个方面:第一,数据点的影响分析,主要研究特定的某几个,特别是研究某一个数据点对于统计分析的影响。这是影响分析初期研究的重点,也是最有实用价值的部分,本文重点就是介绍这方面的内容。第二,广义影响分析,主要研究当模型有微小扰动时,对于统计推断的影响。通常可把扰动归结为与模型有关的若干具体因素所产生。诸如均值的漂移、方差的扩大、自变量的改变等等。
本文主要内容为带不等式约束的线型回归模型数据点的影响分析,通过删除数据点拟合值的影响定义,介绍了若些实用的度量影响的统计量,并重点分析了W-K统计量
二、统计量
下面我们给出Cook统计量的定义。
所以其Cook距离可定义为:
三、W-K统计量
除Cook距离外,比较常用的就是Welsch-Kuh距离,简称W-K统计量(可参见文献[2]).
(一)考虑数据点删除前后对 处拟合值的影响
为了消除尺度的影响,还要除以拟合值的均方误差 。
称为W-K统计量。
(二)考虑删除第个数据点对于 处拟合值的影响
定理1.
(三)考虑删除 个点对拟合的影响
定义1. 给定模型 ,带有不等式约束条件
下,j个数据点 对于拟合值的影响定义为:
称为约束Welsch-kuh统计量。
注意,此时 是一个j维向量,为了使用方便,考虑其范数
显然是一个Cook距离。
定理2. (3.5)
证明:由代入即可得。
参考文献:
[1]赵媛媛、王金德,含有不等式约束的回归问题的残差分析[J].南京大学学报,2001,18(1):1-10.
[2]Belsley,D.A.,E.Kuh and R.E.Welsh. Regression Diagnostics Identifying,
Influential Data and Sources of Variation .New York:Wiley,1980.
[3]唐年胜、王学仁,约束W-K统计量与广义相关系数[J].数理统计与应用概率,1998,13(3):239-246.
作者简介:
陈振华,研究生,硕士,毕业于南京理工大学,现工作于北京工业大学耿丹学院,讲师,研究方向:应用数学。
注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”
[关键词]数据点的影响分析 Cook统计量 W-K统计量 拟合
中图分类号:O1-0 文献标识码:A 文章编号:1671-7597(2009)0110005-02
一、引言
影響分析是统计诊断中十分活跃的分支,其研究内容和方法近年来仍然在不断的发展和开拓。影响分析的内容大致可分为两个方面:第一,数据点的影响分析,主要研究特定的某几个,特别是研究某一个数据点对于统计分析的影响。这是影响分析初期研究的重点,也是最有实用价值的部分,本文重点就是介绍这方面的内容。第二,广义影响分析,主要研究当模型有微小扰动时,对于统计推断的影响。通常可把扰动归结为与模型有关的若干具体因素所产生。诸如均值的漂移、方差的扩大、自变量的改变等等。
本文主要内容为带不等式约束的线型回归模型数据点的影响分析,通过删除数据点拟合值的影响定义,介绍了若些实用的度量影响的统计量,并重点分析了W-K统计量
二、统计量
下面我们给出Cook统计量的定义。
所以其Cook距离可定义为:
三、W-K统计量
除Cook距离外,比较常用的就是Welsch-Kuh距离,简称W-K统计量(可参见文献[2]).
(一)考虑数据点删除前后对 处拟合值的影响
为了消除尺度的影响,还要除以拟合值的均方误差 。
称为W-K统计量。
(二)考虑删除第个数据点对于 处拟合值的影响
定理1.
(三)考虑删除 个点对拟合的影响
定义1. 给定模型 ,带有不等式约束条件
下,j个数据点 对于拟合值的影响定义为:
称为约束Welsch-kuh统计量。
注意,此时 是一个j维向量,为了使用方便,考虑其范数
显然是一个Cook距离。
定理2. (3.5)
证明:由代入即可得。
参考文献:
[1]赵媛媛、王金德,含有不等式约束的回归问题的残差分析[J].南京大学学报,2001,18(1):1-10.
[2]Belsley,D.A.,E.Kuh and R.E.Welsh. Regression Diagnostics Identifying,
Influential Data and Sources of Variation .New York:Wiley,1980.
[3]唐年胜、王学仁,约束W-K统计量与广义相关系数[J].数理统计与应用概率,1998,13(3):239-246.
作者简介:
陈振华,研究生,硕士,毕业于南京理工大学,现工作于北京工业大学耿丹学院,讲师,研究方向:应用数学。
注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”