论文部分内容阅读
众所周知,在传统统计过程控制的应用中,我们对某个过程或产品的监控是通过在特定的时间或地点,使用其个别或一系列的质量指标来完成的。但是在许多实际应用中,某个过程或产品的质量最好通过因变量和自变量之间的函数关系(线性或非线性)来更好地进行刻画。在大数据时代,先进的科技使得统计专家能够收集到大量的关于该过程或产品的数据度量,从而利用统计方法重建这种函数型关系,以此研究该过程或产品随着时间推移的稳定性。即便如此,如何选择合适的统计过程控制的方法,对某些过程或产品的质量进行监控和控制,仍然困难重重且充满挑战。 在该博士论文中,我们试图借助于一些现代统计建模和计算方法,去处理上面所提及到的问题,我们的研究内容主要包括:profile数据控制图在估计参数下运行长度分布及控制线的调整、多元函数型profile数据的第一阶段和第二阶段控制图等。为了达到更佳效果,我们采用马氏链、积分方程的计算方法,借鉴回归调整的思想,利用多元主成分分析等技术,并充分结合这些方法的优点,从而提出简单、有效的方法。下面我们对各部分内容简要介绍。 首先,多数控制图的方法都是基于模型参数已知的情况下来进行研究的。但是在实际中,这些参数是未知的,我们只能用第一阶段的历史数据进行估计并使用估计值代替真实参数。直观上来讲,如果参数估计在第一阶段具有良好的统计性质,比如偏差和方差较小,那么把该估计值用于第二阶段控制图中,应该会有更好的表现。把第一阶段的估计值用于第二阶段控制图中对该控制图产生的影响,在一些文献中已经有所描述,例如,对于单变量控制图和多元控制图,文献中已有若干探讨和研究(如Jones et al.2001,2004; Champ et al.2005和Mahmoud andMaravelakis2010)。在博士论文的第二章里,我们利用马氏链和积分方程的方法研究了profile控制图在参数未知下的运行长度分布,基于此给出了确保一定运行长度误报率的控制线调整方案,从而避免了在参数未知情形下现有方法的误报率大幅增大的缺陷。 其次,如何利用统计过程控制理论,对多个函数型profile数据流进行监控和诊断仍然值得深入研究。文献中缺乏对该类数据有效的建模方法,无法充分地捕捉各数据流之间的相关性。基于此,在第三章中,对于多个profile的第一阶段分析,我们提出了一套新的建模、监控和诊断框架。我们提出了基于回归调整思想的半参数profile模型,将每个profile数据流与其它数据流进行回归,充分捕捉它们之间的相关性;由此给出异常点检验的方法,并确立了统计量的渐近分布。由于该方法不仅能抓住各个profile的主要特征,而且充分利用了不同profile之间的相关性,从而使得监控效果相比于其它方法得到显著提高,一系列的模拟结果也印证了这一点。 再者,多条profile数据流的在线监控和诊断也极具挑战。主要的难点是如何简单有效地刻画各profile数据之间的相关性并将其信息整合到检验统计量中。由于在线监控需要快速计算,因此所提出的控制图需要精细设计。在第四章中,我们建立了一个多元函数型模型来刻画多条profile数据流。我们的方法基于一个基本的假设:各数据流可由相近的基函数进行展开,而数据之间的相关性和数据流的随机性由相应的展开系数(随机向量)来描述。我们利用多元函数型主成分分析对profile数据流进行降维,使用少数函数特征向量来构造多元指数加权移动平均控制图(multivariate exponentially weighted average),提出马氏链方法计算其平均运行长度从而用于快速地寻找控制线。模拟结果说明该控制图可以快速地对异常给出报警;我们还提出了报警后的诊断方法,估计变点位置并确定到底是哪条或哪几条数据流发生了变化,并证明了其大样本的相合性。