论文部分内容阅读
在现实生活中,模式识别问题,特别是多态模式识别问题覆盖领域十分广泛,如医学研究中疾病的诊断、健康检查,公安侦破中指纹识别、面部识别,电力系统、通讯系统、交通系统等许多大型复杂系统的故障诊断等问题,都可归结为模式识别问题。但是,在建立多态模式识别数学模型时,常常遇见特征指标众多,指标间存在多重相关性,而样本数据少,含有噪声、类与类之间的边界不清晰等问题,这致使模式识别模型的参数估计受到严重影响,模型误差扩大,模型的稳健性受到破坏。
基于统计学习理论的支持向量机方法,是一种具有良好的泛化能力的前沿性分类方法,在解决小样本、非线性及高维模式识别问题中表现出独特的优势和良好的应用前景。但是基本的支持向量机是基于两分类问题提出的,关于在多态模式识别支持向量机的研究成果较少。因此,基于高维小样本数据的支持向量机多念统计模式识别模型与方法研究具有显著的学术价值和重要实用价值。
论文在对模式识别、支持向量机基本理论和偏最小二乘方法深入研究的基础上,针对模式识别中训练样本特征知识数据的冗余性和多变量之间可能存在的相关性,以及训练样本类信息的不确定性,将偏最小二乘方法和模糊支持向量机相结合,将偏最小二乘方法用于样本数据的提炼,把二分类模糊支持向量机推广到多态模式识别问题,提出了一种基于偏最小二乘的模糊支持向量机模型。论文的主要研究内容和取得的成果如下:
(1)在对国内外模式识别方法的研究现状分析的基础上,系统学习、研究了分类前沿技术——支持向量机的基本理论和方法,探讨了模糊支持向量机和数据约简方法——偏最小二乘方法的思想和原理,为多态模糊模式识别问题的研究奠定了坚实的基础。
(2)提出了一种新的多态模式识别模型——基于偏最小二乘的模糊支持向量机识别模型。该模型将偏最小二乘和模糊支持向量机的优点相结合,很好地克服了训练样本特征知识数据的高维性、冗余性和特征变量之间相关性,以及类信息的不确定性等对模式识别效果的影响。
(3) 在模糊支持向量机的样本模糊隶属度的确定中,为了得到较为理想的隶属度,论文采用模糊c均值算法来实现训练样本的模糊化,
(4) 利用UCI数据库中的数据集和汽轮发电机组故障诊断数据,对模型在训练速度(支持向量个数)以及识别效果(正确识别率)上进行分析评价,通过实验结果分析可以发现,论文提出的基于偏最小二乘的模糊支持向量机模型相比传统的支持向量机多分类算法具有更高的性能,