论文部分内容阅读
视觉跟踪技术常用于视频监控、虚拟现实和体育赛事等场景,现有的技术受算法和平台等多方面限制,大视野小目标的快速跟踪通常较难实现。主要在于现有的视觉检测和跟踪算法精度和鲁棒性仍然很难达到人类水平,而视觉跟踪平台获取到的图像也难以同时兼顾高帧率、高分辨率和大视野的特性。因此,本文针对视觉跟踪技术实际应用中视觉检测、跟踪算法和跟踪平台各自存在的问题开展研究,具体的研究工作如下:(1)针对单阶段视觉检测算法对于小目标和不同尺度下目标的检测效果不佳问题,提出了一种基于多尺度融合的视觉检测算法。该算法通过注意力融合网络对通道重要性进行重标定在进行通道上的加权融合,通过多尺度融合网络对同一分辨率图像生成适用于不同尺度下目标检测的特征图。实验证明,该算法与改进前的算法相比在VOC07数据库上精度提升了1%,对于不同尺度的同类目标和小目标有较好效果。(2)针对传统相关滤波类跟踪算法在复杂背景和快速运动下目标的跟踪效果不佳问题,提出了一种基于注意力机制的多层次相关滤波视觉跟踪算法。该算法使用大间隔的时空约束相关滤波算法作为基础,生成了时间和空间维度的多层次相关滤波模型;为了评价每个模型的重要性,提出了一种基于均值和噪声的响应图重要性衡量指标均值噪声比。实验证明,该算法与主流的8种跟踪算法相比在OTB50数据库上精度和成功率都达到最高,在快速运动和复杂背景的情况下提升更为明显,平均帧率为25帧/秒,也满足了实时性的需求。(3)针对目前主流的三种跟踪平台无法同时兼顾高帧率、高分辨率和大视野的现象,研制了一种基于旋转振镜的视觉跟踪平台。该平台使用凸透镜组进行视野放大,同时使用双相机的结构对目标进行跟踪,可以在保持原有跟踪平台高帧率和高分辨率优势的同时,进一步提升可用于跟踪的视野,与改进前相比扩大了1.7~9倍。最后,本文实现了一个用于视觉跟踪平台的视觉跟踪软件,该软件调用上述视觉检测和跟踪算法执行目标的检测跟踪任务,通过大量的实验证明了这套视觉跟踪系统的有效性。在加入图像采集组建和控制组件后,系统的响应速度为20帧/秒。