基于K均值样本筛选的支持向量机及其在白酒品牌鉴别中的应用

来源 :南京财经大学 | 被引量 : 2次 | 上传用户:coffeedoly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
白酒是我国的传统产品,对于其产品质量的控制影响着我国制酒行业的健康发展,同时这也关系到消费者的健康权益,有必要对白酒产品进行鉴别。在实际应用中,化学计量学结合模式识别技术对白酒的品质进行鉴别被广泛应用;在模式分类中,训练样本的筛选影响着分类器分类的性能。本文以支持向量机(SVM)作为分类模型,探讨了支持向量对其的影响,结合K均值(K-means)聚类的思想对初始训练样本集进行筛选,以提高分类器的分类准确率以及泛化能力。本文指出训练样本数量影响了模型的泛化推广能力,证明了SVM的分类性能只与支持向量有关,而与非支持向量无关。对于训练样本集进行适当的缩减,提取出可能成为支持向量的样本,有助于提高SVM的分类性能和推广能力。K-means具有运算复杂度低的优点,能够自动寻找到类别中心。本文依照这种思想,在找到类别中心的基础上,找到边界样本,同时删除误分类样本,避免SVM最优分类面发生偏置,从而达到降低置信风险的目的,防止过拟合现象的出现。为了验证该方法的有效性,本文选用了UCI数据库的WDBC、Iris、Wine、Sonar数据集,对比了经典的随机取样、KS样本筛选方法,结果表明本文所提出的K-SVM方法有助于分类准确率的提高。针对白酒的品牌鉴别问题,首先采集不同品牌、多种批次的飞行时间质谱(TOFMS)谱图,经过对仪器的精密度、重复性和稳定性的考察,得到了可靠的实验数据。应用小波分析的方法对原始数据进行降噪处理,进而通过PLS-VIP筛选出350个特征指标。此基础上,应用K-SVM方法进行分类鉴别,并对SVM核参数进行网格搜索优化,与其他样本筛选方法对比,得到了较好的分类准确率,满足了对于白酒品质控制高精确度的要求。本文以单光子电离飞行时间质谱作为检测手段,结合数据预处理的方法,将K-means聚类的方法应用于SVM训练样本的筛选之中,建立了准确、可靠的白酒品牌鉴别方法。本文的研究是对白酒品质鉴别方法的补充,同时也为SVM分类中的样本筛选提出了可行的办法。
其他文献
天时集团能源有限公司(简称天时公司)是中华人民共和国渤海湾盆地海南月东区块石油开发项目的外国合同者。一直以来受公司性质和主营业务限制,公司主要投入于勘探开发业务,在
随着当今社会的发展,世界正在发生翻天覆地的改变,通讯业可以说作为所有产业发展的领头羊已经来到了产业的顶盛时期。它所形成的庞大产业链,对世界经济发展的推动相当可观。
海洋是生命的源泉、资源的宝库,也是孕育重大科技突破的摇篮。海洋科技直接关系到人类社会的可持续发展,是世界各国科技水平和综合实力的重要标志。新中国成立70年以来,随着
探讨公路施工技术管理的关键因素,分析公路施工技术管理的相关内容,研究公路施工技术管理的关键措施。
研究了海水中孔石莼分泌物(总有机碳TOC)浓度对混合重金属(cu+lab;Cu+Cd;Cu+lab+cd)在牙鲆(Paralichthys olivaceus)内脏、肌肉、鳃组织蓄积的影响。结果表明:孔石莼分泌物能显著降低Cu、P
航空制造复杂工件的比例越来越高,对表面粗糙度指标的要求也越来越高,针对如何提高表面粗糙度指标,采用自适应神经模糊算法对表面粗糙度进行预测,经过实际验证,本算法具有较
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
由于钢铁行业是能耗大户,其能源消耗总量占工业系统总能耗的25%以上,其能源成本占总成本的比例在20%以上,在内部挖潜方面,节能降耗、降本增效成为各大钢铁企业内部管控的重要
广大青年是国家的希望、民族的未来。实现中华民族伟大复兴,德智体美全面发展的大学生将是中流砥柱。对于旅游类高校而言,培养出具有较高文明礼仪素质的大学生尤为重要。然而
为了掌握巷道围岩应力对穿层钻孔封孔长度的影响,利用数值模拟软件建立巷道围岩应力分布数值模型,模拟不同的围岩应力情况下巷道应力的分布情况,找出围岩应力的分布规律,确定