基于深度强化学习和元学习的目标跟踪

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:w01225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单目标跟踪要求在一段视频序列中仅根据有限的第一帧信息,在随后时空连续变化的情况中准确找到目标,其中涉及的变化包括空间的变化、时序的变化、目标的表观变化。目标跟踪技术在实际生活的许多方面都有重要应用。本文以孪生网络类的目标跟踪算法为基础研究对象,从网络结构、时序信息建模、参数微调三个角度进行改进。1,从网络结构角度,提出一种改进的二分支孪生网络结构,首先使用传统的孪生网络分别对输入的模板图和搜索图提取特征,计算互相关,进行初步的匹配训练,将训练得到的网络参数的浅层部分作为共享层,深层部分网络参数复制一份作为第二个分支,将共享层参数和第一分支参数固定,对第二分支的参数进行补充训练,同时训练一组向量对两分支进行特征级的融合。可以保证在大规模数据集上训练的特征表示保持有效性,不被特定视频的噪声所劣化,同时又能为特定参数的调整留出改进空间。从而提高了算法的精度,同时也为算法的后续改进提供了有力保障。2,从时序信息建模的角度,本文针对目前孪生网络系列方法在目标跟踪领域的不能利用时序信息,构建了一种可以自适应调整边界框形状的强化学习智能体,将上一帧的边框形状和当前帧的目标所在区域特征图,作为强化学习的状态输入;将三个调整边界框形状的动作作为输出,让智能体在连续的视频帧上迭代式训练,对孪生网络所预测的目标形状进行进一步优化,提高算法的精度。同时,强化学习的马尔科夫过程也将时序信息建模到目标跟踪的问题定义之中,为算法的稳定性也提供了更深一层的保障。3,从参数微调的角度,将跟踪器在特定视频的适应性微调的问题阐释为一个“一样本学习”问题。使用元学习的思路,基于未来的新任务,而非仅仅当前数据,进行梯度优化,得到一种对未来的新任务更加敏感的网络初始化参数。对应到视频目标跟踪的任务中,即训练对未来几帧的目标外观进行表示。为了实现这一功能,需要对传统的梯度下降算法中的优化步长也进行梯度更新。这样训练得到的网络参数对未来的变化具有更强的鲁棒性,也可以利用更少的反向传播次数在新的视频任务时进行更快速的优化。
其他文献
党的十九大报告中明确提出要进一步加快发展现代农业,大力推广农业产业化、市场化发展。农民专业合作社就是发展现代农业的重要抓手。早在2007年,农民专业合作社法的颁布具有
随着无线网络技术的飞速发展,智能交通、电子医疗、智能家居、环境监测等物联网应用的逐渐普及改变着人们的生活和工作方式。数据聚合是物联网中的一项关键技术,而传感器是数据聚合技术中最为重要的组成部分之一,但是传感器普遍存在着能源带宽受限的问题,因此在实际应用中,通常将计算任务外包给拥有无限资源的云服务器。此外,随着定位技术的迅速发展,在一些位置敏感场景中,数据源的位置信息扮演着十分重要的角色,基于位置的
随着自动驾驶、远程控制和智能电网等技术的快速发展,对无线传输的可靠性和低时延特性提出了更高的要求,因此低时延高可靠传输场景获得了广泛关注。为了保证在用户服务质量的基础上对低时延高可靠传输需求进行调度,必须通过合适的资源分配算法实现紧缺频带资源和能耗的充分利用。一些传统的资源分配算法可以根据传输需求控制资源分配的策略,但是却难以根据动态多变的环境做出分配决策的调整,毫无疑问造成了传输资源的浪费。而基
在经济飞速发展的今天,人们的经济发展观念已经得到改变,一味的追求经济发展而忽略环境保护的发展模式已经被抛弃,人们越发的意识到良好的生态环境才是最大的财富,青山绿水就是金山银山。在十七届四中全会结束以后,建设生态文明就被党和国家纳入了战略发展任务之中。并且从立法层面着手展开生态文明建设任务,十三届全国人民代表大会第一次会议通过的《中华人民共和国宪法修正案》将“生态文明”正式载入宪法之中,与之相关的《
老旧的变电站中存在大量的非智能数字仪表,无法自动将仪表检测的数据同步到变电站管理系统中。为此,变电站需要耗费大量的人力物力采集数字仪表的数据并同步到管理系统中。但是采用人工抄表的方式采集仪表数据存在众多的弊端,既无法保证数据的质量,也无法达到仪表数据检测的实时性,为变电站的管理带来了诸多不便。因此需要一种智能的方法自动采集仪表数值并上传数据。视觉监控系统和电力巡检机器人在变电站中的广泛应用,为解决
本文首先从带有7个位势的3 × 3矩阵谱问题出发,借助零曲率方程推导出相应的非线性演化方程族.然后,利用迹恒等式方法构造出该方程族的Hamilton结构.再借助于Riccati方程组求出无穷守恒律.从而证明了该非线性演化方程族的可积性.
本文运用随机森林决策树和最近邻法等算法,预测WEB交互界面不同视觉流程中视觉元素竞争结果的概率分布,为优化WEB交互界面布局提供依据。研究中讨论了界面跳动型视觉流的主要特点,提出WEB交互界面的随机跳动的视觉流特点来源于其内在的视觉竞争机制,对于竞争的影响因子提出猜想,并进行相关性实验验证。对于得到验证的影响因子进行了训练和数据分析,构建了模拟竞争过程的决策树和KNN模型。通过界面优化实验结果,利
县域各类规划由于历史、行政层级等原因造成目前多规并行冲突的局面,不但没有更好地发挥多种规划的作用,反而使规划体系变得更加繁杂,造成各规划之间在执行时存在多方干扰与
目的:1.通过文献收集,获取小儿抽动障碍中医辨证论治的方法和规律,为后续研究打下基础,为临床辨证论治提供客观依据。2.通过临床调查,研究小儿抽动障碍中医证型分布规律及影响抽动障碍的相关因素,为该病的预防与控制提供参考依据。方法:1.选择以“多发性抽动症”或含“抽动障碍”或含“抽动秽语综合症”并且“小儿”或含“儿童”为关键词,时间跨度为2011年1月1日至2018年12月31日收录于中国知网、万方数
随着深度学习,强化学习,元学习等学习模式的蓬勃发展,通用人工智能逐渐成为人工智能的目标。典型地,Alpha Go首先利用自学习模式取得了该方面的革命性突破。智能化特征提取代替繁杂的手工特征提取,越来越成为高光谱影像分类应用中的流行趋势。目前,很多基于深度学习的方法,例如SAE,DBN,CNN等,都在高光谱数据上展示了强大的特征提取能力。尤其是,CNN得益于卷积算子的特殊性,在高光谱数据上取得了非常