论文部分内容阅读
随着现代化工业的发展,对工业生产过程安全、产品质量、经济效益等多方面的要求不断提高,过程监测已经成为自动化领域的重要研究问题之一。随着工业生产过程不断地复杂化、规模化,大量的传感器被广泛地部署在生产设备上,使得海量的生产过程数据得以被采集。同时,随着云计算、大数据、人工智能等信息技术的不断发展,数据驱动方法逐步成为过程监测领域的研究热点。近年来,大量的数据驱动过程监测方法被提出,但是这些单一方法都基于一定的数据假设,存在局限性,难以在不同条件下都得到满意的监测性能。针对上述问题,本文基于集成学习方法,在研究基模型性能差异、基模型数量以及集成模型精度等基础上,提出了多种有效的过程监测方法和整体模型集成框架,具体内容包括:(1)大部分集成模型都没有考虑基模型性能差异对集成效果的影响,在融合决策结果过程中,通常给予不同模型相同的权重。针对上述问题,本文提出了一种基于层次分析法的模型评价方法,综合考虑多种评价指标对多个模型进行优先级评价,并将此评价结果作为模型权重与贝叶斯后验概率相结合,用于故障检测和故障分类。通过在田纳西伊斯曼过程进行验证,得到了比单一模型更好的监测效果。(2)在模型集成过程中,并不是基模型数量越多,集成的效果就越好。反之,如果加入性能较差的单一模型,可能会对最终结果产生负面影响。针对该问题,本文提出了基于集成选择的改进随机森林方法,用于工业过程的故障分类。首先,考虑基模型之间多样性以及单一模型性能,提出了一种静态集成选择方法,选取原始随机森林中的部分决策树构造一个新的随机森林模型用于在线故障分类。其次,考虑到在线样本之间的差异性,提出了一种动态集成选择方法,针对每一个在线样本构造一个新的随进森林模型进行分类,并提出一种加权概率融合方法取代原有的多数投票法。通过仿真试验平台验证了所提方法的有效性。(3)为了进一步提升集成模型精度,本文将深度学习模型与集成学习模型相结合,提出了一种基于深度集成森林的故障分类方法。该方法将单层集成模型拓展为多层集成模型,能够有效地提取特征信息,从而提高分类准确率。在该模型每一层中构建三种树集成模型也就是森林模型,然后将每层的信息提取结果与经过特征选择的原始数据堆叠作为下一层的输入向量,以此类推,直到某层模型性能不再提升,模型训练终止。通过在田纳西伊斯曼平台进行对比试验,验证了方法的有效性。(4)提出了一个系统性的集成模型框架用于工业过程监测。首先,针对不同的过程数据特性和目标任务,进行模型选择。然后,针对已选模型通过多准则决策方法进行模型评价,最终通过决策融合方法将多个模型的结果融合得到最终的结果。此框架为过程操作人员和工程师提供了一个系统的数据驱动工业过程监测操作流程,通过仿真研究验证,该集成方法能够有效提升监测性能。最后,在总结全文的基础上对集成学习方法在过程监测领域的未来研究工作进行了展望。