论文部分内容阅读
传统的粗放型农业生产模式效率低下且对生态环境的污染严重,已经不适应新世纪农业发展的需求。现代农业逐渐摆脱原始农业、传统农业和工业化农业的束缚,进入以知识高度密集为主要特点的知识农业发展新阶段。将现代信息技术、生物技术和工程装备技术应用于农业生产的“精准农业(Precision Agriculture)"已经成为现代农业的重要生产形式。将图像处理和机器视觉等技术的应用是精准农业实施中的主要特色之一。通过对光学图像或者高光谱图像的智能分析,有效提高作业效率。但是光学图像数据提供的信息有限,在很多应用中存在局限性。而高光谱遥感图像因为波段众多,光谱分辨率和空间分辨率都很高,因此对地物的分辨更加准确,在精准农业的应用中具有其他数据无法比拟的优势,已经成为未来精准农业应用中的主要数据形式。这些新的数据分析手段虽然给农业生产带来了革命性的变化,但是另一方面也因为其数据量巨大,不仅给存储和传输带来了困难,同时也给数据的分析和处理带来了巨大的挑战。因此如何有效降低数据的维数,减少数据量是精准农业图像分析中的一个重要课题。本文主要研究局部线性嵌入算法在精准农业数据降维问题中的应用。结合精准农业实施中如杂草识别等问题的需要,主要围绕局部线性嵌入算法监督性的实现、近邻参数自适应选择、适当的分类算法的设计等问题进行了深入研究。主要的研究工作与创新成果如下:(1)信息技术、模式识别技术在精准农业中的主要应用之一就是依据图像和光谱数据完成对作物属性的自动识别。而常规的局部线性嵌入算法是一种非监督算法,直接应用于分类识别中往往效果不佳。针对这个缺陷,提出一种基于Fisher准则的监督局部线性嵌入算法。算法首先对训练样本进行Fisher投影变换,寻找最佳投影方向。在此方向上各类样本具有最大可分性。利用训练样本在该投影轴上的投影距离来构造邻域结构,则可以最大程度得利用训练样本的监督信息指导降维,从而有效提高识别率。实验结果表明,基于Fisher准则的监督局部线性嵌入算法比常规局部线性嵌入算法具有更优异的降维效果,用简单的分类算法就可以实现较高的识别率。(2)局部线性嵌入算法应用于分类识别问题时,其精度还受到另外一个因素的影响,即局部线性嵌入算法主要参数之一的近邻参数κ。该参数选择的恰当与否将严重影响识别结果。但是目前还没有特别成熟的选择算法出现,多数情况下是根据实验结果进行多次反复人工尝试。这也成为局部线性嵌入算法发展中的瓶颈。针对精准农业中所处理数据的特点以及局部线性嵌入算法邻域构造对识别效果的影响,设计一种基于监督局部线性嵌入方法的近邻参数自适应调整的算法。实验结果表明,该方法可以根据所采集数据的分布特点自动确定近邻参数,在保证高识别率的前提下又增强了算法的稳定性和实用性。(3)降维算法只是数据处理的第一步,确保高识别率的另外一个重要环节是分类算法的选择。而局部线性嵌入算法对于新增测试样本必须和训练样本重新训练完成降维后才能进行分类,计算量大,效率低下。根据局部线性嵌入算法利用重构误差构造邻域结构的特点,将测试样本与正负类流形重构误差的大小作为判断训练样本类别属性的根据。这种分类方法是直接基于数据流形本身的特点构造的,又不需要引入新的未知参数,具有应用方便的特点。实验结果证实监督局部线性嵌入和这种分类算法的结合可以保证较高的识别精度。(4)杂草识别是精准农业应用中的主要问题之一。因为自然界生物的多样性,即使同种植物形态颜色上也具有一定的差异,而异类植物却又可能具有相似性。利用传统的机器视觉方法,通过颜色,形态等特征识别精度不高,而且容易受到自然环境的影响。本文主要面向玉米田间实地采集的图像数据完成杂草识别任务。该组图像中环境很复杂,玉米和多种杂草共生。设计了根据形态学方法自动分割杂草和玉米的方法,然后利用监督局部线性嵌入对分割后的图像进行降维,并用支持向量机完成分类识别,最终取得了理想的实验结果。证明了基于Fisher准则的局部线性嵌入算法在非实验室环境下也具有很好的适应性。(5)高光谱数据结合了光谱分析和图像处理的优势,在精准农业中的病虫害监测,品质检测等多个问题中都取得了成功的应用。针对实验室采集的患有条锈病的小麦叶片成像高光谱数据,根据“图谱合一”的思想,将一种图像纹理特征分析手段——灰度共生矩阵和光谱信息进行联合分析,充分利用了成像光谱数据的优势。实验结果表明,这种将传统图像分析手段和光谱数据结合的方法能够更好地发现作物受病害影响的程度,尤其是作物受病害影响初期或者称为隐性病时期,识别效果更优于传统的光谱分析方法。