论文部分内容阅读
特征提取是机械故障诊断的基础,如何有效地获取故障特征信息是故障诊断领域的研究重点和热点。随着数据挖掘技术的不断发展,数据降维算法被引入到故障诊断领域用于信号的特征提取。本文针对故障诊断过程故障数据高维数、非线性化、复杂性等特点,研究基于随机邻域嵌入的机械故障特征提取方法,相关工作如下:针对欧氏距离在高维数据空间中不能提供较大的相对距离差,无法明显体现高维数据对象之间差异性的问题,提出一种基于Manhattan距离的随机邻域嵌入(Manhattan-SNE)算法。采用Manhattan距离衡量高维数据对象之间的相异度,得到高维空间和低维空间数据对象之间相似度的条件概率。UCI数据集和仿真故障信号分类识别验证所提改进算法的有效性。针对随机邻域嵌入算法无法利用现实数据中少量样本标记信息的问题,提出一种基于拉普拉斯正则化度量学习的半监督随机邻域嵌入(semi-supervised SNE, ss-SNE)算法。采用拉普拉斯正则化度量学习对距离矩阵进行半监督学习,利用已标记数据提供的信息,重新刻画数据点之间的距离,从而实现SNE算法的半监督改进。与其他半监督降维算法的对比分析表明所提改进算法的优越性。随机邻域嵌入算法是一种批处理方法,无法获取高维空间到低维嵌入空间的映射函数,由此导致该算法无法对新增数据进行增量式处理。本文构造一种随机邻域嵌入算法的增量形式(增量SNE算法),寻找新增样本点的K近邻,使得新增样本的K近邻的分布形式和K近邻对应的低维映射的分布形式尽可能匹配,实现新增样本的学习。最后,将上述方法应用于实际齿轮箱故障诊断,结果表明上述方法能够有效提高故障诊断精度,验证了算法在实际故障诊断应用中的可行性。