基于注意力机制和多尺度深度学习模型的光学遥感图像分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xuhaibin_213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学遥感图像处理在城市规划,自然灾害防止,地表状态及变化等民事领域一直是备受关注的研究课题,同时,在军事领域也有非常重要的价值。随着航空航天技术的发展和硬件系统的进步,理解和解译复杂和高分辨的光学遥感图像显得尤为重要。这些高质量的光学遥感图像拥有更丰富的信息,比如更多的纹理信息,更复杂的目标和更精细的形状。遥感图像不同于自然图像,其数据来源、目标结构和图像背景都与自然图像有较大差异。由于当前光学遥感图像数据内容丰富且数据量大,传统机器学习方法难以从中提取出有效的特征信息。此外,由于传统机器学习方法中提取特征时需要很大的计算损耗,难以满足大量数据的实际应用需求。近几年,深度学习方法在计算机视觉和自然语言处理等领域都有着广泛的应用。深度学习方法以卷积网络为基础,在当前海量数据和超强计算机的条件下,深度学习模型能够自动并且准确的提取出图像数据的特征。目前,深度学习方法已经在图像分类、目标检测和语义分割等众多图像处理领域取得了出色的效果。本文在当前理论的基础之上,结合光学遥感图像的特点,在卷积神经网络模型中引入多尺度方法,并且充分利用注意力机制对模型中的特征进行自适应融合和增强,进一步提升了深度学习方法在光学遥感图像分类任务中的效果。本文主要研究工作如下:(1)根据光学遥感图像中目标大小变化的特点,提出了一种基于空洞卷积的多尺度深度学习模型。传统的多尺度方法大多数都是以下采样和滤波等方法实现,难以直接和深度学习方法相结合。空洞卷积可以在不增加参数量的情况下增大卷积核的感受野,从而使模型能够灵活处理不同尺度的目标。该多尺度深度学习模型并行的引入多组有着不同感受野的空洞卷积对光学遥感图像进行浅层特征提取,然后将提取到的多尺度特征再送入深度分类模块得到分类结果。实验结果表明该方法在遥感图像场景分类任务中有很好的效果。(2)针对卷积神经网络中的特征融合方法问题,提出了一种基于通道注意力机制的自适应特征融合方法。目前使用较多的特征融合方法是直接相加或者沿通道拼接的方法,这种方法操作简单,但是往往没有充分利用特征中的信息。本文提出的自适应特征融合方法利用通道注意力机制对两个特征图的每一个通道生成不同的权重,然后将两个特征图进行带有权重的相加,最后得到融合后的特征图。实验结果表明该融合方法可以更灵活的对两个特征图进行融合,提升模型特征的可鉴别性和鲁棒性,进而提升遥感图像场景分类准确率。(3)为了更好地获取光学遥感图像中的全局特征信息,提出了通过高阶特征降维的方法获取全局特征,并将其应用到通道注意力机制和空间注意力机制中。当前注意力机制中的全局特征获取方式都是直接采用池化的方法,这种方法简单快速,但是并没有充分利用全局信息,而且没有考虑到特征之间的联系。高阶特征降维方法利用协方差矩阵计算不同特征之间的关系,然后根据协方差矩阵生成最终的全局特征。这种方法可以利用高阶特征,提升模型的非线性性能,进而增强模型的特征表达能力。
其他文献
时滞积分–微分方程是工程中一类重要的方程,在力学和生物学等领域有着广泛的应用.然而,这类方程的精确解却并不容易求得,所以探求该类方程的高精度数值解就显得尤为重要.基于求解常微分方程初值问题的单支方法,本文构造了一类新型单支方法用来求解时滞积分–微分方程初值问题,并在经典和单边Lipschitz条件下,给出了方法收敛性、非线性稳定性和耗散性的证明.在第一章,我们介绍了时滞积分–微分方程的研究背景、历
推荐系统是解决个性化需求的产物。作为推荐算法中应用最广的算法——协同过滤,具有极大的研究价值。协同过滤算法中存在数据高维稀疏问题,导致相似度计算、评分预测存在偏差,选择近邻效率低,严重影响了算法的质量。目前,对该问题的研究存在以下不足:在改进相似度计算的研究中,没有考虑评分差值,没有衡量用户对项目属性的喜欢和不喜欢程度,没有挖掘隐式兴趣;忽略了数据高维的特点,在整个数据集中选择近邻,导致算法运行时
本文主要研究如下形式的分数阶Schr(?)dinger-Poisson系统(?)(1)这里s ∈(3/4,1),t ∈(0,1),且2s+2t>3,其中2s*=6/3-2s是分数阶临界指数,非局部算子(-Δ)α(α=s,t ∈(0,1))是分数阶Laplace算子.在对位势V(x),K(x)和非线性项f(x,u)作适当的假设下,研究系统(1)的变号解的存在性以及多重性.本文主要分为如下五章:第一章
本文中,我们主要研究了 L-商半模与该商半模上的商变换,并对L-半模上的线性函数与双线性函数进行讨论.本文主要分为五个部分,具体内容如下:第一部分讨论了交换半环上的商半模,基于之前了解的L-半模,我们提出了L-商半模.首先,我们提出了关系的定义,并且讨论关系的有关性质,利用有关例子加深理解.而后,通过对关系的研究,确定该关系为等价关系,并由等价关系区别出不同的分类,找出其中的代表元,探索其代表元的
在图像处理和视觉分析中,乘性噪声的去除和缺失像素的修复是图像预处理领域的两项重要任务。在一些实际情况中,乘性噪声和信号缺失总是同时存在的。因此,本文的目的就是要提出一种新的更有效的模型来去除乘性噪声,同时估计缺失像素的位置并填补它们。首先,针对存在乘性噪声而且部分信号缺失的退化受损图像,本文给出了新的数学描述。基于该退化模型以及最大后验概率(MAP)估计,在缺失像素位置未知的情况下,本文提出了一种
混凝土及钢筋混凝土在军事及民用建筑领域应用广泛,因混凝土拉伸强度远小于压缩强度,大多情况下这类材料和结构的破坏是由拉伸断裂引起的,如弯曲破坏、压缩碎裂、应力波在界面反射引起的层裂等,因此,混凝土动态拉伸实验方法及其特性研究一直受到关注。巴西圆盘劈裂实验具有加载简单方便、可利用Hopkinson压杆加载用于动态拉伸强度测试等优点,是目前使用最广泛的间接拉伸实验方法,但巴西圆盘劈裂实验自提出以来,对该
压电液相传感器被广泛应用于生物化学研究领域。目前液相传感器的振动分析主要针对石英晶体的厚度场激励,而电极位于晶体板同一表面上的横向场激励相比于厚度场激励具有很多优势,如品质因数值高、频率稳定性好、晶体老化率低等。此外强耦合3M晶系压电晶体LiTaO3压电耦合系数高,基于LiTaO3的横向场器件应用于液相传感器具有较高的Q值,可以克服较大的液体阻尼,具有独特的优势。然而基于LiTaO3的横向场激励器
当前工程中的巡检任务多由人工的方式实现,人工巡检的方式存在效率低下,巡检频次低,成本过高等问题。随无人机(UAV,Unmanned Aerial Vehicle)技术不断发展,自动巡检很大程度上可取代人工巡检,从而解决人工巡检目前存在的种种问题。对于无人机视觉感知方法的研究是当前智能化巡检的关键点。本文重点对应用于四旋翼机器人的目标检测方案进行研究,主要包含以下两部分:1.基于机器学习的机载目标检
随着航空工业的发展,钣金机匣作为航空发动机的外部承载件,对其可靠性、生产效率、服役性能提出了更高的要求。壁厚渐变回转件作为航空发动机钣金机匣的零件的一种,其材料多为钛镁合金,高温合金,这些材料在常温下存在屈服比高、弹性模量低、回弹严重、材料弯曲能力差、受压时稳定性差等缺点,而热强力旋压技术可提高室温下难成形材料塑形,改善其加工性能,减小旋压力,提高产品的表面质量及生产效率。为有效控制热强旋过程中壁
空心车轴作为高速列车的核心部件之一,需要具备良好的力学性能。其中,空心车轴内部晶粒的大小及其分布的均匀性是决定其综合力学性能的最重要因素之一。具体来说,在轧制成形过程中,轧件内部晶粒细化程度越高、分布越均匀,轧件的力学性能越好。到目前为止,关于三辊斜轧空心车轴成性均匀方面的研究尚无人做过。本文旨在通过对轧件内部晶粒大小及其分布均匀性进行研究,提高轧件的综合力学性能。本文采用simufact仿真和实