论文部分内容阅读
白酒是我国的传统产品,对于其产品质量的控制影响着我国制酒行业的健康发展,同时这也关系到消费者的健康权益,有必要对白酒产品进行鉴别。在实际应用中,化学计量学结合模式识别技术对白酒的品质进行鉴别被广泛应用;在模式分类中,训练样本的筛选影响着分类器分类的性能。本文以支持向量机(SVM)作为分类模型,探讨了支持向量对其的影响,结合K均值(K-means)聚类的思想对初始训练样本集进行筛选,以提高分类器的分类准确率以及泛化能力。本文指出训练样本数量影响了模型的泛化推广能力,证明了SVM的分类性能只与支持向量有关,而与非支持向量无关。对于训练样本集进行适当的缩减,提取出可能成为支持向量的样本,有助于提高SVM的分类性能和推广能力。K-means具有运算复杂度低的优点,能够自动寻找到类别中心。本文依照这种思想,在找到类别中心的基础上,找到边界样本,同时删除误分类样本,避免SVM最优分类面发生偏置,从而达到降低置信风险的目的,防止过拟合现象的出现。为了验证该方法的有效性,本文选用了UCI数据库的WDBC、Iris、Wine、Sonar数据集,对比了经典的随机取样、KS样本筛选方法,结果表明本文所提出的K-SVM方法有助于分类准确率的提高。针对白酒的品牌鉴别问题,首先采集不同品牌、多种批次的飞行时间质谱(TOFMS)谱图,经过对仪器的精密度、重复性和稳定性的考察,得到了可靠的实验数据。应用小波分析的方法对原始数据进行降噪处理,进而通过PLS-VIP筛选出350个特征指标。此基础上,应用K-SVM方法进行分类鉴别,并对SVM核参数进行网格搜索优化,与其他样本筛选方法对比,得到了较好的分类准确率,满足了对于白酒品质控制高精确度的要求。本文以单光子电离飞行时间质谱作为检测手段,结合数据预处理的方法,将K-means聚类的方法应用于SVM训练样本的筛选之中,建立了准确、可靠的白酒品牌鉴别方法。本文的研究是对白酒品质鉴别方法的补充,同时也为SVM分类中的样本筛选提出了可行的办法。