不等式约束的线型回归模型中数据点的影响分析

来源 :硅谷 | 被引量 : 0次 | 上传用户:fz594825946
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]主要内容为带不等式约束的线型回归模型数据点的影响分析,给出不同数据点删除前后拟合值的影响定义,重点介绍若干实用的度量影响的统计量Cook统计量,W-K统计量。
  [关键词]数据点的影响分析 Cook统计量 W-K统计量 拟合
  中图分类号:O1-0 文献标识码:A 文章编号:1671-7597(2009)0110005-02
  
  一、引言
  
  影響分析是统计诊断中十分活跃的分支,其研究内容和方法近年来仍然在不断的发展和开拓。影响分析的内容大致可分为两个方面:第一,数据点的影响分析,主要研究特定的某几个,特别是研究某一个数据点对于统计分析的影响。这是影响分析初期研究的重点,也是最有实用价值的部分,本文重点就是介绍这方面的内容。第二,广义影响分析,主要研究当模型有微小扰动时,对于统计推断的影响。通常可把扰动归结为与模型有关的若干具体因素所产生。诸如均值的漂移、方差的扩大、自变量的改变等等。
  本文主要内容为带不等式约束的线型回归模型数据点的影响分析,通过删除数据点拟合值的影响定义,介绍了若些实用的度量影响的统计量,并重点分析了W-K统计量
  
  二、统计量
  
  下面我们给出Cook统计量的定义。
  
  所以其Cook距离可定义为:
  
  三、W-K统计量
  
  除Cook距离外,比较常用的就是Welsch-Kuh距离,简称W-K统计量(可参见文献[2]).
  (一)考虑数据点删除前后对 处拟合值的影响
  为了消除尺度的影响,还要除以拟合值的均方误差 。
  
  称为W-K统计量。
  
  (二)考虑删除第个数据点对于 处拟合值的影响
  定理1.
  
  (三)考虑删除 个点对拟合的影响
  
  定义1. 给定模型 ,带有不等式约束条件
  下,j个数据点 对于拟合值的影响定义为:
  
  称为约束Welsch-kuh统计量。
  注意,此时 是一个j维向量,为了使用方便,考虑其范数
  
  显然是一个Cook距离。
  
  定理2. (3.5)
  
  证明:由代入即可得。
  
  参考文献:
  [1]赵媛媛、王金德,含有不等式约束的回归问题的残差分析[J].南京大学学报,2001,18(1):1-10.
  [2]Belsley,D.A.,E.Kuh and R.E.Welsh. Regression Diagnostics Identifying,
  Influential Data and Sources of Variation .New York:Wiley,1980.
  [3]唐年胜、王学仁,约束W-K统计量与广义相关系数[J].数理统计与应用概率,1998,13(3):239-246.
  
  作者简介:
  陈振华,研究生,硕士,毕业于南京理工大学,现工作于北京工业大学耿丹学院,讲师,研究方向:应用数学。
  
  注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”
其他文献
[摘要]目的:探讨早期糖尿病肾病与血脂之间的关系。方法:对109例2型糖尿病患者进行血脂各项指标测定、尿微量白蛋白排泄率测定及其他临床指标观察;对照组(N组)为本院70例查体正常者。用放射免疫分析(RIA)测定尿微量白蛋白,用全自动生化仪测定各项血脂水平,把109例2型糖尿病患者按照尿微量白蛋白排泄率(UAER)分成非糖尿病肾病组(NDN组)UAER<20μg/min;糖尿病肾病组(DN组)UAE