论文部分内容阅读
近年来,消费者越来越青睐高品质、无添加、新鲜营养和少加工破坏的食物。鲜榨果汁的出现,正好符合消费者这个需求。本研究以樱桃番茄汁为对象,采用电子鼻和电子舌技术对樱桃番茄从榨汁前整果新鲜度、榨汁前处理、制汁、不同品质果汁混合、灭菌后放置的整个流程进行检测和评估,鉴定不同原料新鲜度、不同前处理方式、榨汁灭菌后放置不同时间和不同混合比例的樱桃番茄汁品质。本文从探索樱桃番茄汁的电子鼻和电子舌数据结构出发,比较基于单独电子鼻和电子舌的樱桃番茄汁品质鉴别方法的性能,然后利用数据融合方法优化樱桃番茄汁品质鉴别方法,最后提出半监督分类算法改善樱桃番茄汁品质分类模型。主要结论如下:(1)采用谱聚类、SL聚类法(Single Linkage clustering, SL)、CL聚类法(Complete Linkage clustering, CL)、Ward’s聚类法、FCM聚类法(Fuzzy c-means, FCM)、κ-means聚类法和ISODATA聚类法(Iterative Selforganizing Data Analysis Techniques Algorithm, ISODATA),分别对3个电子鼻和电子舌数据集底层结构进行探索。2维主成分分析(Principal Components Analysis, PCA)图和3个聚类有效性评价指标(Precision, Mutual Information和Rand Index)都表明,本研究提出的谱聚类算法能比传统的聚类法更好地反映出真实数据结构。(2)采用直接电子鼻检测、水汽处理后再电子鼻检测和电子舌检测,对4组不同混合比例的樱桃番茄汁品质进行鉴定。PCA、CDA (Canonical Discriminant Analysis, CDA)、LVQ (Learning Vector Quantization, LVQ), SVM (Support Vector Machines, SVM)和PCR (Principal Component Regression, PCR)结果表明,水汽处理后再进行电子鼻检测并不能提高对4组樱桃番茄汁的区分,而单独电子鼻或电子舌基本可以实现对混合果汁的分类和品质指标预测。(3)分别采用电子鼻和电子舌对不同原果新鲜度(4℃下储藏16天,25℃下储藏8天)的樱桃番茄汁进行检测。结果表明,单独电子鼻或电子舌可以辨识不同原果新鲜度的果汁,且基于电子舌数据建立的不同原果新鲜度果汁的分类和理化指标预测模型,都比基于电子鼻的好。(4)采用6种数据融合方式(直接融合法、PCA降维融合法、不同阈值的factor F选择法和逐步选择法)建立原果新鲜度追溯模型。结果表明,基于单个仪器建立的回归模型都缺乏泛化性,而数据融合后则可以对验证集样本的理化指标进行很好地预测。(5)比较cluster-then-label半监督分类法和有监督的PNN (Probabilistic Neural Networks, PNN)与LVQ建立的分类器性能。结果发现,对于不同原果新鲜度和不同混合比例的樱桃蕃茄汁数据集,基于谱聚类和FCM的Cluster-then-Label法的测试集正确率都高于两种有监督分类法,且半监督分类器对已知训练集和未知测试集的分类正确率差不多,其模型更稳定更具有泛化性。通过以上结论可知,利用电子鼻和电子舌技术对果汁品质进行鉴别是可行的。选用谱聚类算法可以更好了解果汁的电子鼻和电子舌数据集结构,且基于谱聚类的Cluster-then-Label半监督分类法能在只有少量有标签数据的情况下建立可靠分类模型。同时,当选择合适的特征提取方法后,数据融合比单独使用电子鼻和电子舌都要好。