基于GAN的遥感图像半监督场景分类

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:guoxxjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像场景分类是以遥感图像的内容为基础,用特定的高级语义标签自动对图像进行识别分类,被广泛应用于智慧城市建设、交通旅游规划、自然灾害监测和国防资源管理等领域。由于地球观测技术的进步,海量无标签遥感图像的数量正在急剧增长,如何对遥感图像进行准确有效的场景分类变得尤为重要。然而,遥感图像的标注需要丰富的工程技能和专业知识。因此,如何利用少量有标签遥感图像和大量无标签遥感图像进行场景分类成为研究热点。生成对抗网络是近年来最有前景的半监督学习方法,将其应用在遥感领域,可以解决大量无标签遥感图像无法有效利用的问题。综上,本文基于生成对抗网络的相关模型,致力于增强生成对抗训练时的稳定性、提高判别器对鲁棒性特征的提取能力以及模型的泛化适应能力,进而提升场景分类的性能。主要研究内容如下:1.针对生成对抗训练不稳定、有监督场景分类算法无法利用大量无标签数据以及传统生成对抗网络的特征提取能力不强的问题,以半监督理论为基础,提出一种谱残差门控注意力生成对抗网络。首先,引入谱归一化残差块代替判别器的二维卷积,以增强生成对抗训练的稳定性;其次,引入多分支特征融合模块,将低层特征、谱归一化残差块提取的高层特征以及外部网络Inception V3提取的特征进行融合,从而减少特征损失;最后,在生成对抗网络的判别器中加入结合门控的注意力模块,以增强模型的表征能力。在Euro SAT和UC Merced数据集上进行了验证,结果表明该方法能够有效提取判别力更强的特征,提高半监督分类性能。2.针对遥感图像无标签样本较少,以及传统的区域丢弃算法会导致局部特征信息丢失的问题,提出基于Cut Mix平衡化数据增强分类方法。详细介绍了Cutmix的基本理论和样本平衡化策略。通过特征热力图的可视化分析和UC Merced数据集的对比实验表明,Cut Mix能有效地改善数据增强的效果,提高模型的泛化能力。3.设计并实现基于B/S结构的遥感图像场景分类系统,进行了系统需求分析、总体架构设计、浏览器端设计、服务端设计、网络模型设计以及数据库设计等,通过测试表明,该系统具有一定的便捷性和可用性。
其他文献
随着互联网大数据的到来,人们时刻面临着网络信息过载的问题,加之网络新闻中充斥着大量的“标题党”现象。因此,越来越多的人对文本摘要生成感兴趣。文本摘要技术属于自然语言处理领域,是利用计算机对原文内容进行分析,将关键含义提炼出来,形成简短文本的技术。近年来,大量学者们在文本摘要技术上有所研究,使之有了很大的进步,但依然面临着诸多挑战。本文针对抽象文本摘要方法中存在信息丢失以及未登录词等问题,研究自动关
学位
如今网络自媒体和电商平台逐渐成为大家生活中不可缺少的一部分,用户越来越倾向于在网络上留下自己的评论和看法,由于这些带有情感和观点的文字信息影响着舆论方向以及作为商家和卖家行动的参考,情感分析已经成为一个热门的方向。在单个评论中,经常会出现多个情感的表达,为了更准确的对文本进行分析,诞生了方面级情感分析。方面级情感分析能获得更有针对性更准确的情感表达,已经成为当下研究的热门课题。方面级情感分析的模型
学位
对于事实类问题,问答系统比传统搜索引擎给出的答案更准确与简洁。与关系型数据库不同,知识图谱可以将数据按照逻辑网络的形式进行存储,并能以符合人类认知的方式来描述实体与实体之间语义关系。基于知识图谱的问答系统既有知识图谱的数据存储表示优势,又具备问答系统的优势,是目前关注的热点之一。目前基于知识图谱的问答系统虽然能有效地解决简单问题,但是仍然存在数据信息利用不完全以及语义理解不充分的问题,同时对多跳问
学位
明湖是安徽省唯一项目入选水利部首批幸福河湖建设项目,项目以提升人民幸福感为目标,依托河长制,通过治理河湖和保护生态,打造美丽城市,为市民提供更好的居住生活环境。文章分析了明湖建设过程的具体做法、建设亮点及取得的初步成果,并对项目未来进行了展望。
期刊
面对人工智能引起的新一轮产业变革,安全、可信的智能系统是保障社会实际应用的重要基础。然而,理论研究与实际测试表明智能技术尚不成熟,构建安全可信的模型算法仍是研究领域中的难题。图深度学习模型,例如图卷积网络,因为在一些任务上的出色表现引起了研究人员的关注。然而,图深度学习模型易受对抗攻击产生的对抗样本影响,对抗样本严重影响了深度学习模型的实际性能。因此需要促使研究者设计一种先进的防御方法,以削弱潜在
学位
全面推行河湖长制已进入全面强化、标本兼治、打造幸福河湖的新阶段。建设幸福河湖是推进高质量发展的必然要求,是建设人与自然和谐共生的现代化的重要举措,也是对人民群众美好生活向往的切实回应。文章总结归纳江西省现阶段幸福河湖建设工作,通过梳理幸福河湖建设的背景和意义,分析建设进展及问题,研究提出了幸福河湖后续建设工作的建议,可为进一步完善河湖治理体系,提升河湖治理水平,指导幸福河湖建设和管理提供参考。
期刊
跨模态医学图像文本检索可以通过医学图像检索得到对应的诊断报告或者通过诊断报告检索得到对应的医学图像,向医生提供包括医学图像和诊断报告在内的相关过往病例,可以提高临床决策的准确率和效率。跨模态检索任务需要学习到具有跨模态一致性和类间判别性的多模态特征,以便通过距离度量实现跨模态检索。然而多模态医学数据中医学图像相对于自然图像类间差异性更小且图像模态和文本模态的模态间差异更大,图像模态难以学习到具有语
学位
人类的视觉系统具有选择性注意的特征,如何理解和模拟人类视觉系统的注意力机制,受到学术界和产业界的广泛关注,并提出了大量视觉注意力模型;这些模型主要从场景观察者的主体视角,对视觉场景进行理解和模拟。然而,在智能监控、人机交互等领域,发展空间常常来自对场景中客体视觉注意力的深入理解。例如,识别监控场景中目标个体的注意力有助于准确预测其后续行为,等等。因此,建模视觉注意力既需要从场景观察者的主体视角开展
学位
自我国确立土地有偿使用制度以来,产业用地低价出让、低效利用、闲置浪费等问题日益突出。本文通过对我国产业用地供给问题的研究,以上海、广州、西安、宁波四市“产业用地指南”编制和浙江省“标准地”探索为案例,系统分析了各项政策的特点和不足,最后对优化我国产业用地供给提出了相关建议,以期为相关人员提供参考。
期刊
人群计数任务是智能视频监测系统的重要组成部分之一,不仅在城市公共安全领域而且在商业领域都有非常重大的应用价值和意义。因为卷积神经网络的出现,人群计数算法的性能得到了显而易见的提升,同时也面临了诸多挑战,比如背景杂乱、多尺度变化,人群计数算法提升空间依然存在。本文针对以上问题,对人群计数算法展开探讨,研究内容如下:1.提出了一种基于语义细化的空间金字塔人群计数网络。该网络包括三部分:骨干网络、空间金
学位