论文部分内容阅读
智能制造的深度发展,使得制造车间的数据呈现了爆炸性的增长。如何挖掘上述数据的价值,为制造车间的运行优化与决策提供服务,已成为当前的研究热点。机器学习是制造数据分析与处理最常用的方法之一。然而,在实际制造系统中难以获取高质量的带标签数据。因此,研究无监督的机器学习方法,以处理海量无标签的制造数据具有广阔的应用前景。谱聚类是一种无监督流形学习方法,能充分挖掘隐藏在高维非线性数据中的本征结构,并根据本征结构将数据分为不同簇。但是,谱聚类假设数据分布于单一流形上,而制造数据往往分布于多个流形上。因此,本文针对多流形分布数据,改进谱聚类算法,并将其应用于故障识别,同时提出了一种对新增样本快速识别故障的方法。本文面向多流形分布数据,提出了一种迭代多流形谱聚类算法。针对多流形分布数据存在交叉、重叠的情况,利用局部切空间相似度构建邻接矩阵,通过迭代优化的方式,让属于不同类别邻近点之间的权重趋近于0,属于同一类别邻近点之间的权重相对较大,从而学习到更加准确的数据结构,提升聚类效果。该算法在五个仿真数据集上进行验证,结果表明,该算法与传统聚类算法和其他谱聚类算法相比,在保持聚类结果的稳定性的同时取得更优的聚类效果。针对制造数据无标签的特性,提出了基于迭代多流形谱聚类算法的无监督故障识别方法。该方法利用时域分析方法,从振动信号提取原始高维特征;运用迭代多流形谱聚类算法,将高维数据映射到低维本征空间,并将数据分为不同簇,同时提取包含各簇故障信息的低维特征;使用局部离群因子分析算法,对低维特征进行分析,识别出正常状态数据;利用低维特征中表征故障类型的故障指标,对不同故障进行识别。将提出的故障识别方法应用到凯斯西储大学轴承数据集上。结果表明,该方法能准确识别正常状态和不同等级故障。针对新增样本,提出了新增样本低维特征的高效求解方法,并基于低维特征对新增样本进行故障识别。利用基于迭代多流形谱聚类算法的无监督故障识别方法,对已知数据进行故障识别,并学习数据的本征结构和故障相关知识;基于Nystr?m公式和数据结构对新增样本低维特征进行估计,并结合低维特征和故障知识,识别新增样本的故障类型。采用凯斯西储大学轴承数据集,对所提的无监督故障识别方法进行验证。结果表明,该方法能快速、准确地识别新增样本的故障。最后,对全文进行了总结,并展望了未来值得进一步研究的方向。