偏最小二乘回归模型及其在教育统计中的应用

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:shanlai_lu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
偏最小二乘法(Partial Least Squares,PLS)是一种新型的多元统计分析方法,它是普通最小二乘法(Ordinary Least Squares,OLS)的一种改进,许多实际问题中,需要使用自变量对因变量建立回归测方程,但当涉及的自变量较多时,自变量间往往存在着相关性,或者,当我们所取得的样本点数量小于自变量个数时,都可以引起多重共线性问题,这时如果仍采用OLS建模,那么这种共线性就会严重危害参数估计,破坏模型的稳定性。解决建模中的共线性问题,现有不少方法,其中偏最小二乘法是一种较为有效的方法。 本文对偏最小二乘法进行了探讨和研究,主要做了以下几方面的工作: 第一,本文提出了多重共线性问题,讨论了共线性在回归建模中引起的危害,并介绍了处理多重共线性的几种常用方法。 第二,本文讨论了单因变量PLS和多因变量PLS的算法,明确了单因变量PLS和多因变量PLS的不同。 第三,从多因变量PLS出发,提出成分提取的观点,结合主成分分析、典型相关分析的思想,对PLS算法做出了改进.这种基于成分提取思想下的PLS方法,不但具备原PLS方法建立预测方程的功能,而且对所提取的成分,还可以进行类似于主成分分析、典型相关分析的一些工作。例如,可以通过对提取的成分进行分析,来对自变量和因变量做出解释,这类似于主成分分析和典型相关分析中对成分的命名,可以测量成分对自变量和因变量的解释能力,这类似于典型相关分析中的典型冗余分析,还可以向典型相关分析一样,利用所提取的典型成分之间的相关,来判断自变量系统与因变量系统间的相关性。本文还就成分提取思想下的PLS算法,编写了Matlab程序,将原始数据代入后,可直接获得预测方程和各种分析结果。 第四,PLS方法最早产生于化学领域,现已被应用于对经济数据的研究中。本文在此基础上,将PLS法应用于教育研究中,选取大学某专业学生的高考成绩和大学一年级专业课成绩,应用PLS法建立高考各科成绩对其大学专业课成绩的预测模型,并对各影响度进行了相应的分析。同时,利用此数据,将偏最小二乘回归(PLSR)与普通最小二乘回归(OLSR)、主成分回归(PCR)、逐步回归建立的回归模型进行了比较,发现由PLS法拟合的回归方程,对由样本的变动所引起的扰动误差的影响最小,可见用PLS法建立模型最为理想.
其他文献
在晋北选取田普(主要成分为45%二甲戊灵)和使它隆(主要成分为20%氯氟吡氧乙酸)2种除草剂,设置低、中、高3种施用量,研究其在燕麦田的杂草防除效果以及对燕麦的安全性。结果表
为了揭示长期不同施肥条件下,褐土土壤水溶态磷(H_2O-P)含量变化及其剖面分布特征,筛选出最佳的施肥方案,以连续进行了27 a的长期不同施肥处理定位试验为研究对象,共选择7个处理,即不施肥处理(N_0P_0M_0)、2个氮磷化肥配施处理(N_1P_1M_0、N_2P_2M_0)、3个有机无机肥配施处理(N_2P_1M_1、N_3P_2M_3、N_4P_2M_2)和单施高量有机肥处理(N_0P_0
目的:观察丙种球蛋白联合甲基强的松龙治疗儿童重症过敏性紫癜的临床疗效。方法:将63例重症过敏性紫癜病儿随机分为治疗组30例,对照组33例。对照组给予常规治疗给予(静脉应用
迷宮闯一闯
运用DEA模型测算中国城市文化产业的投入产出效率。结果表明:城市文化产业投入产出效率整体不高,纯技术效率明显低于规模效率,地理分布呈现"东高西低"的特征,表明中国城市文
大鸨(Otis tarda),国家一级保护的鸟类。该文通过对2006~2009年期间,北京市野生动物救护中心对北京地区的受伤、受困大鸨的救助情况进行分析,讨论大鸨途经北京地区的迁徙规律、伤害
文章利用被中国证券监管部门处罚的舞弊公司及未舞弊公司为对象,考察机构投资者在公司治理中是扮演监督者还是跟随者角色。研究发现,从公司舞弊前一季度到后一季度机构投资者
以国产错流膜过滤装置在14℃左右进行黄酒过滤试验。经孔径为0.18μm膜过滤后的酒蛋白质下降17.3%,OD值下降16.0%,总多酚略有下降,黄酒的非生物稳定性明显提高,且理化指标符