基于深度二阶统计特征的图像分类方法研究

来源 :大连大学 | 被引量 : 0次 | 上传用户:hey_yuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类技术是计算机视觉下最基础、最重要的技术分支。在人脸识别、智慧医疗和移动支付等领域具有很大的应用市场。其中的纹理图像分类,则是图像分类中一项十分重要的技术,在材料纹理识别、管道检测等领域中,有着巨大的应用潜力。随着一系列社交媒体应用、短视频应用的急速发展,互联网上无时无刻都产生着大规模的图像数据,如何有效提取图像中有效信息就变得愈加迫切。深度卷积神经网络具备很强地抽取图像特征表达的能力,而且深度二阶统计特征可以由深度特征本身计算获得,具有更高的计算效率,可获得更加鲁棒的图像表达。因此,本文探索了二阶统计特征信息如何有效地与深度特征结合、注意力机制相结合的图像分类方法研究,其主要工作可以总结如下:(1)提出双线性卷积特征下的高斯描述子(RDGD),并有效应用在纹理数据集等图像任务中。RDGD结合双线性卷积神经网络(B-CNN)和高斯描述符作为新的纹理表示方法,其中由B-CNN计算所得的外积作为协方差的粗略估计被嵌入到高斯表达中。同时为了克服高维小样本情况下,估计所得样本协方差不太鲁棒,在前一步基础上,采用矩阵幂归一化操作,消除了协方差粗略估计带来的影响。在三个纹理数据库上的实验结果表明,相比于其基准B-CNN和当时最好方法,RDGD都有着显著的提升。(2)提出基于二阶响应转换机制与计算机视觉下注意力机制相结合的图像分类网络框架—SoRTA-Net。通过计算深度特征的二阶统计特征,并在此基础上应用注意力机制,进一步使得深度卷积神经网络的表达图像的能力大大增强。为了探索更加灵活的二阶响应转换机制,提出RSoRT模块(由该模块组合形成的网络称为SoRTA-Net),该模块可以针对性地校正特征响应。同时可以健壮地对复杂的图像特征作二阶特征建模。通过在一系列数据集上广泛评估,相对于其基准方法SoRT,SoRTA-Net的性能显著提升,同时和当时最优方法也有一定可比性。
其他文献
近年来,利用组织工程技术构建有利于神经再生的微环境,已成为神经再生的重要研究方向。组织工程支架材料多种多样,自组装多肽和静电纺丝技术制备的纳米支架都具有独特优势且
白噪声背景中指数衰减正弦信号的参数估计技术是数字信号处理领域的一类经典课题,广泛应用于低频机械光谱学、线性系统识别以及核磁共振等领域。而现有的算法很难在参数估计
矿浆预热过程是高压酸浸(HPAL)工艺中的基础和关键部分,其过程工艺参数的稳定与否决定了高压酸浸冶炼过程能否安全高效的运行。目前对于高压酸浸过程控制的研究主要集中在工
近年来,随着智能化产品的快速发展和消费水平的普遍提高,手机已经成为现在用户必备用品之一,由于手机USB数据线主要功能是给手机充电和连接电脑进行数据传输的,随之的市场空
光场相机凭借着可以记录当前场景三维信息以及强大的后期处理能力,成为近年来的研究热点。随着相机小型化的发展以及图像计算能力的提升,相较于已经商业化的微透镜型光场相机
温度是实际应用中重要的控制参数,由于被控对象复杂程度逐渐提高,在控制温度方面面临许多问题。如何提高控制效果、满足复杂系统的控制要求,是目前温度控制领域重要的研究方
在世界经济全球化、资本市场日新月异的背景下,中国企业受到众多投资者关注,面临的风险和机遇也都大大增加。为了使企业更好的适应瞬息万变的投资环境,规避未知的财务风险,企
无线设备数量的海量增长,多媒体业务不断增长的服务质量需求,加上无线网络资源的限制,使得当前接入技术所使用的固有无线电频谱分配方法有了越来越大的压力。基于上述频谱资
人群异常行为检测是使用安装在公共场所的闭路电视摄像机捕获和检测异常事件,例如斗殴,交通事故和踩踏,然后及时发出警告。它在智能监控领域具有广泛的应用。近年来,人群异常
捷联惯导是一种不需要其他辅助信息就可以独立自主完成导航任务的系统,因该技术特点,使载人航天、战略武器等关系国家利益和安全的飞行导航控制系统均采用捷联惯导。捷联惯导