论文部分内容阅读
质量的定义是:一组固有特性,满足要求的程度。从上述定义中可以看出对产品质量的监控就是对一组特征的监控。在早期,人们往往关注产品单个主要特征,这类针对单个特征的监控方法就是单变量监控方法。但是在现实生活中,人们对产品的需求一般会表现为多个方面,这样,产品的监控就变为对多个变量的监控。最简单也是最自然的解决方法是对多个变量分别进行单变量监控,但是这种方法的监控效率会随着变量数的增加而下降,而且有时甚至会得到错误的结论,因此需要对多个变量联合监控。传统的多变量控制图是基于正态假设设计的,在数据服从正态分布时可以取得比较理想的效果,而当数据不服从正态分布时,传统多变量控制图往往表现较差,此时一些基于数据挖掘方法的现代多变量控制图往往会有更好的表现。不过基于非正态数据设计的控制图往往有其特定的针对性,因而在其针对的数据类型时有较好表现,但是在其他情形下容易失效。如果将受控状态和失控状态的数据看成两类,那么在这两类数据都可以获得的时候,一分类问题将监控问题变成了分类问题。但在传统的监控问题中,失控数据往往无法获取。人工对照方法(artificial contrast)通过人工生成失控数据解决这个问题,但是这种方法的监测性能受人工生成数据的影响比较大,实时对照方法(rea0l-time contra0st)的出现避免了这个问题,此时不再对新样本进行分类而是监测分类产生的其它统计量,如分类准确率,这样可以提高控制图的监测能力。本文将距离引入实时对照监控框架,主要有以下贡献:(1)将基于LDA的距离引入控制图的设计并对参数进行分析。作为一种常用的分类器,线性判别分析(LDA)的基本思想是寻找分离超平面将不同类数据分离,在数据满足正态性假设时常常有较好的表现,由于对位于分离超平面同一侧的点同样对待,基于分类的统计量的灵敏性会比较差。在RTC框架下以点到LDA的分离超平面的距离设计LDA-D、LDA-D0和LDA-D1三个控制图,并与基于概率的LDA-a0、LDA-p0和LDA-p1控制图进行比较。之后研究参数设置对控制图的影响。(2)将基于KLDA的距离引入控制图的设计。LDA在数据线性可分的时候可以取得较好的效果,但在数据线性不可分时效果较差,这个时候非线性分类器的优越性就体现出来。核技术的本质就是通过数据变换将原始数据映射到更高维的空间,这样就可以将原来线性不可分的数据在高维空间中线性可分,将核方法应用到LDA上得到的KLDA分类方法。在RTC框架下基于点到KLDA的分离曲面的距离设计KLDA-D0和KLDA-D1两个控制图,基于KLDA对受控样本分类准确率设计KLDA-a0控制图,在数据不服从多元正态分布时对构建的KLDA-D0、KLDA-D1和KLDA-a0控制图的监测性能进行分析,为了便于比较,选择SVDD控制图作为参照。(3)将KL散度和加权KL散度引入控制图的设计。在信息论和概率论中,KL散度常被用来测度两个概率分布之间的差异,所以也被称为KL距离。在RTC框架下基于KL散度设计KLD控制图,在数据不服从多元正态分布时对构建的KLD控制图的监测性能进行分析,为了便于比较,选择SVDD控制图作为参照。KL散度对所有样本赋予同样的权重,这样显然忽略了时间的影响。为了更好的考虑时间因素的影响,引入加权的KL散度。基于加权KL散度设计WKLD控制图,权重参数λ会影响WKLD控制图的性能。在数据不服从多元正态分布时对构建的WKLD控制图的监测性能进行分析,为了便于比较,选择由WKLD退化而成的KLD控制图作为参照。选择合适的λ值可以使WKLD控制图更有效的监测数据变化。