论文部分内容阅读
深度学习是当下研究的热点和重点,不同于传统方法需要人工设计特征,深度学习自动地提取图像中的特征,并且提取的特征更具有代表性,也更加鲁棒。自然图像处理已经有很多优秀的网络结构在分类、目标检测以及语义分割上取得了较优的效果。深度学习中一些成熟优秀的方法被逐渐应用于遥感图像处理中,特别是在土地利用分类、变化检测、目标检测等领域,已经有很多针对遥感图像的新方法被提出。但是,遥感图像语义分割领域的研究相比其他领域较少,主要是因为构建遥感图像语义分割数据集的难度大,训练分割网络的耗时长,分割效果难提高等。本文在已有成熟深度学习网络的基础上,针对遥感图像中飞机目标的检测和分割问题提出了一些有用的改进方法。本文在飞机目标检测和分割两个步骤中针对遥感图像中飞机目标的特点提出了一些具体的改进方法。在目标检测中,考虑到飞机目标中存在一些小目标,并且有些小目标之间的间距小,定位难度高,本文在经典目标检测网络Faster Region-based Convolutional Neural Networks(Faster R-CNN)的基础上添加了Feature Pyramid Networks(FPN)结构,使得在检测时结合多尺度信息以提高检测精度。在语义分割中,首先,为了保证在逐像素点分类时能够结合更多的高分辨率信息,本文通过减小网络下采样倍数来减少下采样时造成的信息缺失;其次,在使用大型网络ResNet-101作为基础网络(backbone)时,由于内存的限制而无法将下采样倍数减小到1,所以本文使用反卷积层这种可训练的方式恢复特征图到输入图像大小,使用跳跃连接方式结合高分辨率信息;最后,在使用交叉熵函数作为损失函数时,训练图像中的容易样本所造成的误差会掩盖困难样本所造成的误差,这会导致训练出来的模型对于困难样本的分割效果差,为了解决这个问题,本文使用Focal Loss替代交叉熵损失,为容易样本分配小的权重,为困难样本分配大的权重。另外,本文还自建了飞机目标检测样本集和语义分割样本集,并基于样本集对所提出的改进方法进行了实验对比,实验证明了本文提出的改进方法可以明显提高飞机目标的识别精度。