论文部分内容阅读
视频目标跟踪技术随着计算机视觉、人工智能等领域的发展逐渐成为热门的研究课题,其应用领域也涉及到我们生活中的方方面面,例如:智能交通系统中对目标车辆或行人的定位与分析,安防系统中对可疑目标的跟踪,人机交互过程中对特定动作的识别等。本文选取近几年来备受关注的TLD跟踪模型(Tracking-Learning-Detection)作为切入点,分析了算法的结构原理与流程框架,并且在此基础上研究了TLD模型应用于多目标跟踪的情况,最后基于改进后的算法设计出一个稳定的目标跟踪系统,实现对多个目标的长时跟踪。 本研究主要内容包括:⑴介绍和分析TLD长时间跟踪算法,从检测跟踪学习三个方面出发介绍了算法的框架结构和执行流程,分析和比较了TLD跟踪模型与传统跟踪检测算法的优势与不足。⑵针对TLD算法中的两个问题:窗口扫描耗时过多和只能进行单目标跟踪提出了改进方法。针对原算法中扫描阶段遍历图像耗时过多问题,提出一种判别机制来筛选输入到检测器的扫描窗口数量。针对多目标跟踪问题,在初始化阶段,引入跟踪目标唯一标识ID概念,对多个跟踪目标进行有效的区分,跟踪过程中,跟踪模块检测模块与学习模块的目标模型训练均以此ID来实现对多个目标的分别处理。⑶设计并实现了一个基于TLD模型的多目标跟踪系统,该系统利用MFC应用程序框架与Opencv视觉图像处理库编写,基本交互操作有从视频文件读取视频,从摄像头读取视频,多目标跟踪,跟踪目标坐标位置保存以及视频截图。该系统对基于TLD模型的跟踪算法进行封装,提供操作性强简单易用的交互界面,经相关视频数据测试,结果表明系统具有较好的多目标实时跟踪能力,较高的可靠性和稳定性。