融合时域和分水岭信息的车辆检测算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:khsim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实时视频图像车辆目标检测时,为了克服行进中车辆背景噪声和阴影带来的准确率低、漏检率高等问题,提出一种时空融合和内外标记的分水岭车辆检测算法.通过相邻视频三帧差法得到的时域运动变化信息结合Canny算子得到的边缘图像相结合,得到时域掩模图像.利用文中提出的基于二次重构、内外区域标记、梯度修正的分水岭空域算法对运动区域及其周围区域进行分割,解决了一般分水岭算法的过分割现象.将得到的结果进行投影,以提高运动状态下车辆的检测精度.实验结果表明,在车辆背景噪声和阴影的影响下,该算法的检测效果仍然较好,车辆漏检率降低到4.90%,算法的准确性、鲁棒性和适应性较好.
其他文献
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法.利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围.实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中.
目标跟踪是无人机的关键技术之一.无人机目标跟踪容易因相机运动、尺度变化等场景的影响,导致跟踪漂移或丢失.提出一种多帧监督的相关滤波无人机目标跟踪算法,加入多帧信息,根据视图的像差监督响应图变化率,有效地提高跟踪器的识别能力.采用裁剪矩阵引入真实负样本,并加入多个历史帧信息提高滤波器的鲁棒性.采用欧几里德范数定义响应图的像差,通过监督像差的变化防止跟踪漂移,得到目标的准确位置.根据相似度进行目标模型更新.在UAV123和VisDrone2019数据集上与其他算法对比实验.结果显示该算法在相机运动、尺度变化等
基于孪生网络的目标跟踪算法将跟踪问题建模为目标特征和搜索区特征之间的匹配问题.匹配程度通常是根据二者特征之间的相关响应来衡量.目前该衡量方式仍存在以下局限:一方面,对目标的不同区域使用的是相同的特征提取器,没有考虑到目标内部和轮廓处的区别;另一方面,在特征之间相关性的求解过程中,模板空间结构是固定的,无法很好地应对目标形变时的情况,鲁棒性较差.为解决上述问题,提出了一种双分支孪生网络目标跟踪算法SiamDAH(Double Adjust Head Siamese Network for Object Tr
在合作博弈的理论研究中,经典的合作博弈解概念在求解过程中没有体现出局中人的有限理性和互动博弈行为.而在现实博弈环境中,联盟的分配方案更多是通过局中人间理性互动与策略博弈形成的.引入理性因子和控制因子来描述局中人在博弈过程中的决策行为,建立了考虑互动行为的合作博弈模型,并利用连续蚁群算法对合作博弈进行求解.算例表明该解法可以保证分配方案满足有效性和个体理性,并能快速得到联盟的唯一分配方案.这为合作博弈的求解提供了新的思路与工具.
微卫星是遍布于人类基因组中的短串重复序列,肿瘤组织的微卫星由于重复单位的插入或缺失而导致微卫星长度的改变的现象叫做微卫星不稳定性(Microsatellite Instability,MSI).MSI型胃癌往往拥有独特的分子表型以及临床病理特征,且微卫星的不稳定性决定了胃癌患者对免疫疗法的反应是否良好,因此MSI状态的术前检测对于胃癌患者治疗方案的制定具有重要意义.传统的MSI检测方法需要进行免疫组化及基因分析,不仅需要增加额外的成本,而且在临床实践中难以推广至每一个患者.应用图像特征提取技术和机器学习算
情感分析是自然语言处理领域的重要任务之一,情感分析任务包含显式情感分析和隐式情感分析.由于隐式情感不包含显式情感词语,情感表达更加委婉,所以面临更大的挑战.提出基于图注意力神经网络的隐式情感分析模型ISA-GACNN(Implicit Sentiment Analysis Based on Graph Attention Convolutional Neural Network),构建文本和词语的异构图谱,使用图卷积操作传播语义信息,使用注意力机制计算词语对文本情感表达的贡献程度.针对多头注意力保存重复信
微博谣言的广泛传播给当今社会造成了日益严峻的负面影响.基于深度神经网络的方法存在缺少大量带标签的数据.研究发现,谣言经常伴随负面情感,而非谣言则伴随正面情感,考虑到谣言与非谣言之间表现出的相反情感倾向性,提出一种将谣言检测和情感分析这两个高度相关的任务结合起来学习的多任务学习方法,为了尽可能多地挖掘不同任务之间的关联,全面分析谣言检测任务的特征,设计了一个由BERT和BiGRU联合的多任务学习框架(BERT-BiGRU-MTL,BBiGM).利用权值共享的方法对两个任务进行联合训练,同时提取出任务之间的共
在糖尿病患者中,糖尿病视网膜病变(Diabetic Retinopathy,DR)是导致失明的主要原因.针对眼底图像中存在极难发现的微动脉瘤等微小病理特征的问题,提出了一种注意力机制模块.该模块通过融合特征图原本的特征信息与注意力单元得到的通道信息,为微小特征增加了网络的权重,再使用除操作去除特征图中的冗余信息,得到注意力机制特征作为双任务的输入;针对均方误差(Mean Square Error,MSE)损失难优化和交叉熵(Cross Entropy,CE)损失未考虑错分DR等级的代价,设计了多任务学习模
多尺度卷积神经网络被广泛应用在图像去模糊领域,但在不同尺度上对网络参数进行独立设定的方法会导致网络训练难,并且产生参数过大、稳定性降低、无约束解空间等问题.针对多尺度算法存在的上述问题提出了跨尺度共享网络权重并融合DenseNet的图像去模糊算法.该模型采用编码器-解码器结构,并通过引入密集块来改进该结构,从而形成独特的编解码器密集网络,能最大程度获取深层次特征信息.同时提出跨尺度权重共享的方法,使得在尺度迭代的过程中共享参数,显著降低了训练难度,明显提升了稳定性,优势是双重的.将训练所得模型在大规模运动
针对现有医学图像处理方法在人体复杂结构组织器官分割中的不足,提出复用低层特征信息的Mask R-CNN网络.该网络可对特定组织器官识别时同时进行分割,为了提高包含较多细节信息的低层特征层的利用率,将低层的特征信息添加到高层的特征中,使低层与高层特性优劣互补,将原始图像首次长宽压缩两次后的特征层定义为C1层,而后分别通过复用C1层和复用依次卷积的C1层这两种方法实现.并将主干网络进行了精简,以加快网络的训练速度,降低识别和分割的时间.以下颌骨作为应用对象,自建包含1064张下颌骨CT图片的数据集,按9:1的