论文部分内容阅读
在实际工业生产中,产品质量、生产效率以及操作设备的可靠运行都极大地依赖于对关键质量变量(主导变量)的实时测量。但由于工业现场的恶劣环境、检测技术和经济成本的制约,往往难以直接采用硬件传感器测量质量变量。对于这种情况,可以建立软测量模型对质量变量进行预测估计。充分完备的过程数据是建立软测量模型的基础,虽然能够通过分布式控制系统方便地获取辅助变量,但为其确定对应的主导变量却相对困难。导致训练样本中包含了大量的无标记样本,而仅有少数的标记样本。标记样本的稀少使得常用且相对成熟的监督型软测量方法在实际应用中受到了很大限制。因此,本文在半监督学习框架下,运用流形学习、集成学习和主动学习等方法,进行了智能软测量建模研究。论文的主要研究内容如下:(1)针对工业过程的非线性和多阶段特性,提出了基于仿射信息重构的半监督极限学习机软测量方法。首先,采用最近相关谱聚类将训练样本集划分为多个子集。然后,在半监督学习框架下,利用仿射信息重构极限学习机的Laplacian矩阵,并通过贝叶斯后验概率融合各子模型的预测结果,得到最终的主导变量输出值。数值例子和实际炼钢过程的仿真结果说明所提方法在处理标记样本稀缺情况下的多阶段建模问题是有效的。(2)结合集成学习和半监督学习,提出了一种自适应集成半监督软测量建模方法。在半监督方面采用k近邻方法对未标记样本进行伪标记,并对伪标记样本进行质量评估和筛选,得到筛选样本集。在集成学习方面对标记样本集和筛选样本集同时采用Bagging算法生成样本子集,并利用不相似度算法对两类样本子集进行自适应匹配。所提方法中的伪标记样本筛选和自适应匹配过程,在保证了集成学习差异性的同时,也提高了集成学习的精确性,从而有效提升了软测量模型的回归精度和泛化能力。(3)针对主动学习中模型性能提升不稳定的情况,提出了基于近似线性依靠的主动学习软测量方法。所提方法将未标记样本所包含的额外信息与向量组间的最小表示误差对应。通过近似线性依靠算法对未标记样本进行质量评估,为模型训练提供最具信息量的样本,以更少的标记代价获得更高效的性能提升。在硫回收过程实验中,与现有的随机选择策略对比,基于近似线性依靠的主动学习策略表现出了更高的预测精度和更快的收敛速度。