论文部分内容阅读
本文以烟草企业中的生产经验规律为基础进行数据挖掘和信息抽提,针对现行烟草质量分析中存在的问题,相应开发出质量分析方法,以达到烟叶和烟气中的大类化学物质的快速准确的预测。主要进行了以下几方面工作:
(1)利用均匀设计原理在烟叶样品的近红外光谱主成分空间挑选接近均匀分布、有代表性的样本建立烟叶化学成分的近红外定量分析模型,模型的拟合功能虽稍逊于全样本及对照样本集所建模型,但预测结果最佳。此外,随年份增加建模样品,考察模型的动态稳定性,结果表明模型的拟合及预测功能较单一年份有明显提高。
(2)分别对卷烟企业批量生产的两批卷烟分析数据集,进行了卷烟物理、化学及主流烟气指标的因子分析与典型相关分析,结果表明卷烟物理、化学及理化指标与主流烟气存在很强的内在联系,某类指标与其它指标间的相关程度与选取哪些因素进行分析密切相关,得到的有关结论随所选因素的变化而变。例如,CO在数据集D1中,与所考察的卷烟物理、化学指标间的相关性很弱,而在数据集D2中,CO与所考察的卷烟物理、化学指标间的相关性却很强。
(3)以卷烟主流烟气为因变量,卷烟物理、化学指标(近红外光谱)为自变量,假设样本在自变量空间的分布等同于其在因变量空间的分布,提出以典型变量优选样本子集与最优化方法相结合的CCA-KNN-最优化保形映射预测方法去预测主流烟气。结果表明两类数据样本D1、D2中分别以理化指标和化学指标为自变量对焦油、烟气烟碱和CO的预测准确率最高,分别为83.53﹪和85.07﹪。对数据样本D2,若以物理指标+近红外光谱为自变量,对焦油、烟气烟碱和CO的预测准确率为85.07﹪。