基于上下文自校准双重注意力的目标检测算法

来源 :激光与光电子学进展 | 被引量 : 0次 | 上传用户:xrp880823
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于先验框设计(anchor-based)的多类目标检测算法存在超参数多、泛化能力差、正负样本不平衡的问题。针对这些问题,提出一种基于改进无锚(anchor-free)方法的目标检测算法。首先,针对传统算法在多类目标检测任务中难以获得鲁棒的特征表达的问题,构建基于上下文结合的自校准双重注意力模块,通过混合空洞卷积组获取多感受野信息;然后以低维空间嵌入的方式进行自校准获取上下文空间信息;最后将空间信息与通道信息结合,增强算法特征表达能力。针对在多类目标检测任务中由于目标尺度变化大、外观不规则而易引入背
其他文献
为了解决网格运动统计(GMS)算法在图像发生旋转时特征匹配时间过长的问题,提出一种改进的快速GMS图像匹配算法。首先采用快速特征点提取和描述算法对图像进行暴力匹配以得到初始匹配点对,根据汉明距离选取其中匹配质量较高的特征匹配对。然后通过计算匹配对特征点主方向的差值得到两个图像的近似旋转角度,根据旋转角度直接确定运动核的最佳形态。最后采用GMS算法根据运动核来实现正确匹配与错误匹配的区分,避免循环计
输电线路上的绝缘子长期处于强电场和恶劣环境中,其安全性的监测尤为重要。为了快速精确识别航拍图像中的绝缘子,提出了一种基于Gaussian YOLOv3(You only look once)的绝缘子检测算法。首先,通过增加网络的输出和改进网络的损失函数输出预测框。然后,结合高斯分布的策略输出对应预测框坐标的均值和方差。最后,采用多阶段迁移学习解决小数据集容易发生过拟合的问题。实验结果表明,本算法能
针对Gabor小波提取存在维数灾难和特征冗余的问题,提出一种小波变换结合多特征融合编码的人脸特征提取方法。所提方法利用2D-Gabor小波提取归一化的输入图像特征信息,得到不同尺度和方向上的Gabor特征;对于每个特征图像,应用基于Gabor小波的多特征融合编码模型提取图像的L-F(Local Gradient Coding-Fusion)特征;最后使用直方图统计图像特征以选取适当的分块数目,利用
为了提高近景摄影测量中编码标志点的编码容量和解码准确率,提出一种由定位十字标、起始数字、编码字符组成的合作编码定位对应圆型标志方法。通过高斯滤波对采集的图像进行平滑的预处理,可以消除噪声;利用自适应局部阈值法对目标进行分割,可以获取字符区域与十字标区域;使用TensorFlow-MLP(Multilayer Perceptron)神经网络训练好的字符样本库对字符进行分类与识别;对十字标区域进行填充
为了实现对光学元件表面不同尺寸尤其是微小尺寸缺陷的精确检测,以典型的光学元件表面缺陷即麻点和划痕为研究目标,提出了一种基于散射场分布拟合逼近的表面缺陷检测方法。实验结果表明,本方法可以对光学元件表面的微小尺寸缺陷进行快速有效的检测,且拟合计算结果与样件原始尺寸的相对误差基本小于5%,验证了本方法的有效性。此外,本方法还解决了现有测量方法精度低、结构复杂的问题,为精确检测光学元件表面的微小尺寸缺陷提
某型警用激光眩目器主要应用于安防领域,发射对人眼较敏感的532nm绿激光照射人体目标,可以使嫌疑人目标暂时性失去视力。为提高激光利用率,需要使激光光斑尽可能覆盖有效人体目标范围。测试时使用摄像机获取视频,利用Gentle Adaboost算法,通过基于数字信号处理器(DSP)的视频处理系统实现了行人目标检测及测定行人大小,同时通过单片机控制电路,根据行人大小控制激光镜头自动调焦,以适应行人目标。
相比于卷积神经网络,图卷积网络更适合处理不规则的点云数据,但其存在网络层数受限以及固定的标准化聚集方式影响点云语义分割结果的问题。针对这些问题,提出一种用于点云语义分割的深度图注意力卷积网络。该网络通过残差连接来加深图卷积网络层数,可以有效解决网络过深所导致的梯度消失和网络退化的问题,采用注意力机制可以使网络有选择地关注最相关的邻域点并为其分配不同的注意力权重。同时在每层图卷积之后重新构建图形,从
采用不同的扫描策略,通过激光熔化沉积技术制备出TC4钛合金.通过光学显微镜(OM)、X射线衍射仪(XRD)、扫描电子显微镜(SEM)和电子万能材料试验机研究了扫描策略对TC4钛合金组织和性能的影响,利用X射线衍射法对TC4合金XOZ平面残余应力的演变和分布进行分析.结果表明,扫描策略影响了网篮组织的形态,进而影响了 TC4合金的力学性能.TC4样品在回旋扫描策略下的拉伸强度和屈服强度最大,分别为1251.7 MPa和1250.0 MPa,而在单向扫描策略下TC4样品的拉伸强度和屈服强度最小,分别为991.
图像语义描述模型通常采用编码器-解码器方式实现图像语义描述,模型存在对图像特征利用不充分,图像目标的位置信息提取不足等问题。针对此问题,提出在编码器部分融合注意力机制的图像语义描述算法,通过解码器上下文信息对不同图像特征的注意力权重分配,从而提高图像语义描述的表达能力。并在Flickr30k和MSCOCO数据集上进行了验证,模型在BLEU-4评价指标上分别提升了1.9%和0.8%,实验证明了本文算
基于对SSD(Single Shot MultiBox Detector)目标检测算法的分析,提出了一种基于深度学习的深层次多尺度特征融合目标检测(DMSFFD)算法。首先将SSD的特征层与相邻特征层进行融合,在融合之后的特征图中加入尺寸为3pixel×3pixel的卷积层,以减小上采样的混叠效应。之后进行更深层的特征融合,分别对较小的三个卷积层进行上采样操作,然后对4个特征层进行concate操