烟叶分级中若干特征筛选方法的研究

被引量 : 0次 | 上传用户:yy19871003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
烟叶是具有重要经济价值的农产品之一,其质量的好坏直接影响到烟草行业的经济收入和烟民的身体健康。现阶段,我国在烟叶收购过程中,大多是通过人工方式来对其进行分级,这种带有主观因素的分级方法不仅影响烟叶分级的正确率,而且常引起不必要的纠纷。因此,烟叶的智能分级迫在眉睫。烟叶的正确分级率和分级速度直接关系到智能分级系统的实际应用。在保证正确分级率的前提下,分级速度不仅仅与分级模型有关,更与所用的特征个数有极大的关系。本文针对特征筛选进行了深入的研究。具体研究工作如下:1.烤烟烟叶图像的采集、预处理和特征初筛选。利用搭建好的系统,采集2013年(462片烟叶)、2014年(1172片烟叶)和2015年(1429片烟叶)烟叶的透射图像;首先对采集图像进行背景分割、去噪、预处理;其次,提取烟叶的形态特征、颜色特征、纹理特征和脉络特征共39个特征;为提高烟叶分级的速度,基于聚类的思想对特征进行初筛选,并人工直接去除一些相关性很大的特征,使得特征从39个减少到24个。2.烤烟烟叶分级模型的建立。分别建立稀疏表示(SRC)、基于密度的稀疏表示(DSRC),支持向量机(SVM)、随机森林(RF)等烟叶分级模型,他们对2013、2014和2015年烤烟烟叶的测试样本的分级正确率和分级时间分别为:90.1%、92.4%、80.2%;92.8%、93.6%、80.7%;88.9%、92.1%、76.8%;92.38%、96.6%、83.14%;所以本文的特征深度筛选都是基于随机森林分级器进行的。DSRC是对SRC的一种改进模型,基于密度的思想对SRC的字典进行选择,减少了SRC所用的字典个数,在保证正确分级率的情况下,提高了分级速度。3.深度特征筛选。为进一步提高分级速度,对初选后的特征进行了深度筛选。首先建立了一个判断特征重要性的分级模型;根据每个特征的重要性,将24个特征减少为20个;然后采用改进的粒子群算法、蚁群算法、遗传算法和特征被选概率算法分别获得较优的特征组合,在一定的分级正确率下,特征个数分别减少为14、16、15、13。这四种方法对42类烟叶分级的正确率和分级速度分别为:82.70%、0.083s;82.49%、0.090s;82.59%、0.088s;82.27%、0.076s,考虑烟叶的分级时间和分级速度,本文选用改进的粒子群算法选择的特征组合最为最优特征组合。
其他文献
随着汽车工业的快速发展,机动车造成的能源短缺和尾气排放已经成为了世界各国亟待解决的问题之一。新能源汽车的研究和推广为汽车行业的可持续发展和人们的快捷便利出行提供
在十月革命胜利以后,列宁同志在许多重要著作中,对计算和监督的重要作用,要求和作法,都有深刻而详尽的指示。今天我们重温列宁同志的这些教导,对于在统计战线上进一步肃清林
本文分析了花岗岩风化地层中的"孤石"形成的内在机理;探讨了花岗岩"孤石"的水平与垂直方向的分布规律;提出了对含有"孤石"的花岗岩地层要采取工程地质调绘与物探、钻探相结合的综合
道路与桥梁工程作为我国现代社会的基础性工程,与国计民生息息相关。随着社会经济的高速发展,我国道路与桥梁工程建设步伐日渐加快,且在实践过程中积累了许多宝贵经验,由此确
以道德同情和社会批判为特征的"底层文学"是新的历史条件下典型的"问题文学",对"底层文学"的讨论乃至争论,不仅彰显了中国严重失衡的社会关系,而且也透视出中国当代文学批评
演讲稿是为演讲准备的书面材料。它既是一种实用性比较强的文体,也是目前考场作文较为亮人眼目的文体之一。一篇好的演讲稿,它既能帮助演讲者赢得经久的掌声,也能作为考场作
目的:观察低氧训练对大鼠心、肝、肾、海马组织细胞凋亡及HIF-1α、Bax、Bcl-2表达的影响,探讨低氧训练的适应机理。方法:70只SD大鼠按体重随机分为7组,每组10只,即正常对照
我国在社会投资、地方财政、国家税收、银行信贷等方面对房地产过度依赖,房价房租已经远超百姓有效支付能力。其原因,从供给看,主要是地价成本高、税费成本高、资金成本高、
贵州旅游业高速发展的同时,旅游危机事件也接踵而至,给正在发展中的旅游业带来了巨大的冲击,尤其是抗风险能力弱的中小旅行社更容易受到各种突发性危机事件的影响。因此加强