基于卷积网络模型和检测机制联合的相关滤波跟踪算法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:xndrz1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪广泛应用于视频监控、人机交互、视觉导航、医学诊断等多个领域,近些年目标跟踪的技术取得了重大发展,但仍然面临着一些挑战。目标快速运动导致边界效应,边缘处检测时受背景信息的干扰,导致跟踪框漂移。跟踪的目标长时间被完全遮挡后又出现到视野中,跟踪算法对背景错误响应影响目标模型更新结果,从而导致跟踪失败。因此,本文基于核相关滤波的跟踪算法的基础上进行深入研究,提出一些改进的方法,主要研究的内容和创新点如下:提出了一种基于混合高斯模型的目标有效信息区分检测机制。首先融入目标区域的局部图像显著性来得到BRISK算法阈值,然后采样得到图像内关键的特征点,利用光流法将移除图像的异常特征点筛除,接下来对目标区域中图像进行均匀分块,根据块图像中心特征点的分布特征建立起混合高斯模型,再对于块图像内剩余特征点分别与模型进行匹配,若匹配成功则为背景特征点,否则为目标特征点,通过混合高斯模型对复杂情景下目标和背景信息进行有效的区分。最后将块图像内特征点输入到朴素贝叶斯分类器中计算特征得分,通过特征得分调整输出框的位置,并根据块图像与目标位置的相似度分配的权重值组成强检测器,进而弱化跟踪框内目标边缘处背景信息对滤波器分类的影响。提出了一种多卷积层特征激活映射的目标跟踪改进方法。首先图像增强处理后利用局部特征进行卷积操作的非线性映射,通过细节互补重建出高分辨网络模型结构,在卷积神经网络框架下对图像不同分辨率中进行多尺度特征提取,然后利用梯度加权的类激活映射将目标像素空间梯度引入导向反向传播中,使得多卷积层特征图谱突出细粒度细节,从而减少图像内噪声对算法模型的目标定位产生误差。最后判别式稀疏编码的权重值自适应融合多卷积层特征响应结果,提高跟踪算法的准确度。本文通过视频序列实验与多个传统的目标跟踪算法进行对比分析,结果表明,基于混合高斯模型的目标有效信息区分检测机制,可以缓解快速运动后图像模糊产生的边界效应,减轻跟踪滤波器对目标响应时受到背景信息的干扰。当目标长时间遮挡后出现,检测机制根据学习模块的约束项重新定位到目标区域。多卷积层特征激活映射的目标跟踪改进方法,利用边缘处细节特征得到互补的高分辨率网络模型提取更多的目标特征信息,提高复杂情景下目标跟踪的稳定性,特征图类激活映射后融合滤波器响应结果,提高算法的鲁棒性。
其他文献
赋有可变二维码的烟标因其在防伪溯源、宣传营销等方面的优势正逐渐成为主流的烟草包装形式。随着印刷企业赋码作业规模的持续扩大,其生产质量不稳定,印刷精细程度无法保证的缺陷越发突出。针对此问题,本文基于目前印刷企业中烟标可变二维码的整体喷印流程,首先进行了可变二维码喷印过程的数值模拟及墨滴形态的分析;其次进行了二维码喷印工艺参数对二维码符号等级的影响研究;最后对烟标可变二维码喷印质量优化进行了实验研究。
车联网(Internet of Vehicles,Io V)是一种因特网在车辆领域的应用。车联网的基础是车载移动互联网,并通过相关的通信协议相互连接的大型通信网络。在智能交通领域,Io V是最重要的组成部分。Io V负责将车辆相互连接起来,以达到消息共享、消息通信的目的。由于Io V开放的特性,攻击者可以截取实时广播的信标信息,通过分析所截取的信标信息获取驾驶人员的习惯、车辆运行的轨迹、驾驶人员的
近年来,深度学习的应用不仅在图像识别、文本生成等领域表现突出,在自然语言处理方面也效果显著。自然语言处理系统在生活中比比皆是,比如手机智能助手在理解用户请求之后,就能通过文字或语音的方式反馈用户信息。人类之间主要通过语言的方式进行沟通交流,以达到知识分享、扩展人际关系等目的。然而,目前全球在使用的语言超过五千种,要想精通多门语言是一项艰巨的任务。此时,机器翻译作为自然语言处理领域中的一个重要分支部
本文对驾驶行为特征进行了关联规则挖掘,以改进的K-means算法和改进的Apriori算法为主要研究目标,并使用标准UCI数据集和泰迪杯数据挖掘大赛中的驾驶行为数据集来验证算法的有效性。首先,将驾驶行为数据进行预处理,对异常数据进行清洗和删除,防止脏数据对挖掘结果的影响。由于Apriori算法本质上只能挖掘离散型数据之间的关联规则,而驾驶行为特征参数在空间上是连续的,因此根据K-means算法对驾
老挝位于东南半岛北部,属于东南亚国家,且与中国毗邻,作为“一带一路”倡议沿线国家之一,其发展命运紧密地和中国联系在一起。由于两国之间语言不通且国内外对老挝语的研究较少,这严重制约了两国的交流与发展,因此本文的研究为老挝语的研究提供了基础,对老挝语其他后续任务的研究提供了重要的研究价值,可以推动老挝语自然语言处理领域的进一步研究。通过对老挝语的语言组成成分、老挝语句子特征、以及老挝词结构特征的分析和
全面推进依法治国,积极发挥法制在国家治理中的积极作用是我国的一项基本国策。自建国以来,我国公民的受教育程度有了很大提升,但当合法权益受到侵害时不会采取合法的途径解决问题,其主要原因是法律意识依旧淡薄。构建面向法律领域的问答系统可以为民众提供法律咨询,因此具有很大的应用价值。问答系统按照答案生成方式分为检索式问答系统和生成式问答系统。法律领域由于其专业性、严肃性,生成式问答系统效果不佳,而检索式问答
声学波束形成技术(Acoustic Beamforming)是以声辐射的逆向重建过程为基本理论,通过对麦克风阵列获得的信号进行延时求和,从而在与阵列相距固定深度处重建声场的分布。声场中最大响应所在位置即为声源。波束形成技术可以对瞬、稳态声场进行重建,对中、远场声源有较好的识别能力。传统的波束形成重建平面声场需要对距离麦克风阵列一定深度的平面上进行扫描重构。如果要在空间内重建三维声场,则还需在深度上
随着能源互联网的快速发展,分布式能源交易在交易市场中的分量也在日益增长,但目前仍存在一些问题,主要包括用户交易信息不透明、不公开以及用户信息数据不对称等。区块链技术作为一种新兴技术,具有去中心化、交易公开以及数据透明等优势,与分布式能源交易场景有着很高的契合性。电力数据具有实时性的特点,对区块链系统的共识机制具有较高的性能要求。所谓共识机制就是保证区块链系统中节点一致性的算法,不仅会影响区块链系统
推荐系统能够从许多的数据中挑选出具有价值的信息,帮助用户找到所需的产品或服务,在近几年得到了越来越广泛的应用。然而,目前的推荐系统仍然存在着许多的问题,如数据稀疏、自然噪声和冷启动等,导致推荐系统不能获得准确的用户偏好。本文主要针对自然噪声和数据稀疏展开研究。在推荐系统中,当用户对商品进行评分时,会导致推荐系统的数据不一致。这些不一致性,即所谓的自然噪声,会影响推荐结果。本文为了校正推荐系统中存在
在资产确权登记、项目选址等实际的自然资源决策应用场景中,面对海量的自然资源文档和数据信息,依旧存在着自然资源决策系统客户端移动不便,实时性不强、数据采集到决策应用时间长等问题。因此,本文尝试对无人机倾斜摄影测量技术支持下的自然资源移动决策支持系统集成的关键技术进行研究,并对其应用进行了探讨与分析。这一套方法对于无人机倾斜摄影测量技术的发展推广以及提升自然资源分析决策的效能有一定的科学意义与应用价值