基于卷积神经网络的三种粒度的图像识别模型研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zhyanhz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别是计算机视觉研究范畴内的一个主要探索方向。利用计算机对图像进行剖析和理解,从而实现不同条件下的目标或对象的辨别,是人工智能领域中具备研究价值的一部分。基于卷积神经网络的图像识别模型是指利用图像以及已有的标注信息,完成卷积神经网络模型的构建、学习、验证,产生一个能够用于该领域图像的识别模型,这样的模型应该具备较强的鲁棒性和迁移性。以预识别目标的粒度为考量,图像识别任务包含了图像级目标识别、区域级目标识别和像素级目标识别三类。本文围绕应用于上述三种类别的模型展开研究,具体的研究内容包括以下三个方面:1、研究了图像级目标识别任务的模型。在VGG模型的基础上提出一种用于高分辨率小目标识别的HRST-Net模型,该模型在提高分类识别准确率的同时,能够有效地将小目标的位置信息直观的反映出来。现有的应用于高分辨率小目标图像的模型,在图像缩放中会丢失目标关键特征且无法有效显示目标位置信息,本文所提出的模型中改进的VGG图像分类网络能够有效地解决当目标的尺寸远小于图像尺寸时,在图像缩放过程中造成的目标特征缺失问题。同时,模型中的改进的Grad-CAM关键区域识别算法能够在小目标的分类识别基础上以热力图的形式完成对目标的直观展示。本文模型以胸部X光影像肺结核识别为例进行了实验验证,在保证较好性能的同时识别准确率达到了 83.5%。同时本文还使用了 CT影像的肺部炎症识别中进行实验验证,最终的准确率也达到了 78.2%。2、研究了区域级目标识别任务的模型。本文利用胸部X光影像的肺结节识别,分析了 Faster RCNN、YOLO等识别模型对数据标注的依赖问题,提出一种不完整标注数据集处理的unCL-GAN模型。该模型能够利用不完整标注的数据集,生成完整标注的数据集,配合现有的识别模型进行学习,从而提高区域级目标的识别准确率。现有的目标检测模型的前后景区分机制和目标选择机制要求训练数据集必须包含完整的人工标注信息,否则会造成目标特征的缺失或混淆。将本文模型作为现有识别模型对不完整标注图像的预处理模型能够有效地解决该问题,充分保留目标的关键特征。本文以不完整标注的病理图像数据集为例,通过实验证明标注了 70%和50%的数据集经过本模型预处理后,再经过现有区域级识别模型学习,得到的模型的识别精确度有了显著提升,使最终的识别准确率接近完整标注的识别准确率,达到了 80.9%和75.7%。3、研究了像素级目标识别任务的模型。在unCL-GAN模型的基础上提出一种用于像素级目标的识别的NNI-Net模型,该模型能够更精确地完成目标的细节特征识别任务,提高了像素级目标的识别精确率。像素级目标识别任务要求将识别的准确率规范到像素级别的精度,因此需要对现有模型进行改进,以提高模型对像素级目标识别的精确度。本文模型将U-Net结构融入生成对抗网络,修改了模型对像素判定的损失,并加入了自定义的上采样层进行细节特征的捕获,从而提高了模型的识别精确度。本文以两个眼底影像的视网膜血管识别为例进行实验,并与现有模型进行对比,结果证明本文提出的模型在识别精度上分别能够达到最好的0.963和0.973。同时再次使用胸部X光影像的肺部轮廓识别对模型进行再次验证,最终的识别Dice系数达到了 0.972±0.005。本文以卷积神经网络的图像识别模型为基础,分别针对图像级、区域级、像素级三个不同粒度的目标识别任务中提出了提高识别精度的方法,其中针对图像级目标识别中的高分辨率小目标识别为区域级目标识别模型的搭建提供了思路,并由此扩展出了基于不完整标注的目标识别模型,该模型包括两个分支结构,其中一个分支结构能够支持像素级目标识别模型的研究。本文通过实验证明提出的模型能够有效地解决图像识别模型在数据预处理、模型搭建、预测精度等方面遇到的实际问题,从而丰富了基于卷积神经网络的图像识别模型的应用领域。
其他文献
学位
柬埔寨城乡之间的差异和农村地区的发展一直以来备受关注,是柬埔寨政府研究的长久话题。尤其是医疗卫生服务方面,关系着民众的幸福健康,是农村地区建设和发展中要重点突破和改革的问题。完善柬埔寨农民群体的医疗卫生保障和服务,可以缓解深度困扰柬埔寨农村群众的疾病问题,为农村群众提供安全、健康的生活环境,促进农村地区的经济社会发展,进一步缩小城乡间的差距,对推动柬埔寨农村地区的整体发展、提高农民群体人口素质具有
学位
新媒体的发展催生了新的C2C营销模式。国内外知名品牌乘借着新媒体这艘巨轮,展开新媒体营销,并取得良好成效。如今中国的C2C营销也由借鉴西方国家逐渐演变成拥有适合本国环境的营销策略。网络新媒体已成为一种广泛使用的营销工具,以吸引潜在客户。由于网络新媒体营销成本低廉,因此特别吸引了客户对客户(C2C)卖家。通过了解产品并与卖家实时互动,客户还可以从网络新媒体营销中受益。我们从中国最大的微博平台新浪微博
不同民族的思维习惯、行为习惯都会受到本国文化的制约,因此产生了一定数量的文化负载词。这些文化负载词有着独特的民族文化烙印,是翻译中较难处理的部分。口译和字幕翻译有相同之处,释意理论所提倡的脱离源语语言外壳对于字幕翻译指导意义极大。鉴于对纪录片字幕翻译中文化负载词的研究较少,本文以国产纪录片《大数据时代》为例,运用释意理论对该纪录片文化负载词进行分析,发现该纪录片对文化负载词采取了意译、直译、音译加
物联网中存在许多独立自治域,每个域都有大量的传感器节点,现有信任模型大多只能评估传感器节点的域内信任,忽视了跨域信任,跨域信任的缺失使节点信任成为“局部信任”,信任只在同一个域内有效,节点信任无法实现动态迁移,阻碍了节点跨域交互。为此,多自治域环境下的跨域信任模型的研究成为物联网领域迫切需要解决的关键问题之一。已有的跨域信任模型多为集中式架构,通过中心服务器运行节点信任评估算法评估节点跨域信任。但
考虑“闲鱼”为代表的C2C二手市场与供应链回收的竞争,利用Stackelberg博弈,分别构建制造商、零售商和第三方回收下的闭环供应链模型及无回收基础模型,分析闭环供应链的定价决策及回收渠道选择。研究发现:(1)回收活动总能增加制造商和零售商的利润;(2)存在C2C二手市场时,二手市场与供应链在回收环节的竞争会损害闭环供应链各方利润;(3)当二手市场交易成本较小时,第三方回收模式是制造商和零售商的
奶油为焙烤食品提供了一种宜人的香味。本文以奶油为原料,鉴定分析其主要成分和挥发性风味化合物,着重分析对奶油风味具有重要贡献的极性组分,并比较不同碳水化合物的添加对奶油中关键香气化合物的影响。首先利用NMR和GC-MS技术鉴定加热前后奶油中的组分和挥发性香气物质,将两者之间的变化结合起来分析推测对奶油中关键香气物质具有重要影响的组分。然后利用NMR技术分析经乙醇提取的极性组分的组成,并将其添加到去除
随着新型农业经营主体的发展势头日益壮大,我国农业生产方式明显发生了本质性的变化,农业进入了现代化发展新阶段,但同时也面临着结构性失衡的局面。随着农业产业规模化的形成,新型农业经营主体要做大做强则必须投入更多的资金,而缺抵押、少担保、风险高则困扰着商业性金融资本对农村农业产业发展的投入,由此而引发的“融资难”“融资贵”难题成为制约其发展的重要因素。政策性农业信贷担保体系是政府通过财政资金支持,专为新
随着大数据的不断发展完善,供应链管理自身存在许多固有的盲点,面临着诸多挑战。区块链技术能够帮助供应链管理解决这些盲点挑战,使企业通过高效实施供应链管理,率先占据市场领先地位,但目前依然存在一些挑战。本文首先针对供应链管理存在的问题进行分析;其次,通过构建区块链技术形成创新型的核心应用模式,对食品行业的供应链进行系统分析,并详细描述区块链技术给食品供应链管理创造的价值;最后,总结出区块链技术与供应链