【摘 要】
:
随着深度学习的发展及神经网络在图像识别等计算机视觉任务中取得的显著效果,使得深度学习在诸如目标追踪、目标检测、行人再识别、图像检索等计算机视觉任务中被广泛应用。显著性检测作为一项在其他计算机视觉任务中的数据预处理技术成为了研究的热点,随着视频设备的普及,人们面对的场景往往是动态变化的,所以视频显著性检测成为一个热门的研究方向,它旨在通过特定的算法检测出连续运动的能引起人眼关注的显著性目标。本文将视
论文部分内容阅读
随着深度学习的发展及神经网络在图像识别等计算机视觉任务中取得的显著效果,使得深度学习在诸如目标追踪、目标检测、行人再识别、图像检索等计算机视觉任务中被广泛应用。显著性检测作为一项在其他计算机视觉任务中的数据预处理技术成为了研究的热点,随着视频设备的普及,人们面对的场景往往是动态变化的,所以视频显著性检测成为一个热门的研究方向,它旨在通过特定的算法检测出连续运动的能引起人眼关注的显著性目标。本文将视频显著性检测模型分为两个模块:静态模块和动态模块。首先,进行基于频域先验知识的静态图像显著性检测;然后在静态模块的基础上,通过动态显著性检测模块进行视频帧的时空特征融合,得到最终的动态视频显著性图。具体地,本文的主要工作如下:(1)对视频帧进行超复数傅里叶变换进行频域视觉显著性分析。通过提取视频帧的四元数特征,构建四元数图像,进行四元数傅里叶变换进行频域显著性分析得到视频帧的频域先验知识,并作为静态图像显著性检测模型的输入。(2)构建基于频域先验的静态图像显著性检测模块,并在该模块的基础上探索多尺度空间分析的超复数傅里叶变换得到的显著性先验对于图像显著性检测算法的有效性。该静态模块采用对称卷积的结构,即有两个网络输入分支,将当前视频帧及其取反图像、频域先验知识作为网络输入,并运用基于共享参数的迁移学习的方式将Image Net预训练的网络权重初始化静态模块的网络参数进行网络训练,然后在公开的图像和视频显著性检测数据集上进行测试,并和不加频域先验知识的静态图像显著性检测模型进行定性和定量对比;(3)构建基于时空关联的动态视频显著性检测模块。首先,通过静态模块获取当前视频帧对应的静态显著性检测结果;然后,通过光流估计法Flow Net2.0计算当前视频帧的光流,并利用该光流计算当前视频帧的运动特征;最后,将当前视频帧、其对应的静态显著性检测结果作为动态模块的模型输入,并将产生的各层网络特征和当前视频帧的运动特征进行特征融合,进而进行基于时空关联的视频显著性检测。该动态模块采用基于VGG-16模型的全卷积神经网络结构,使用基于共享参数的迁移学习的方式用Image Net预训练好的网络参数对动态模块的网络权重进行初始化。并和已有的视频显著性检测算法在公开的视频显著性检测数据集上进行定性和定量对比。本文所提出的视频显著性检测方法在公开的视频显著性检测数据集上进行测试,并和其他已有的视频显著性检测算法进行定性和定量的比较。
其他文献
近年来随着人民物质生活水平的提高,老龄化的趋势日益加快。人口老龄化问题对我国养老服务造成了巨大压力。老年人陪护尤其是高龄老人的陪护问题已成为越来越亟待解决的社会问题之一。陪护机器人是一种典型的服务机器人,其能完成陪护工作的前提是有一个安全可靠的定位导航。本文设计并开发了一种智能陪护机器人定位导航系统,所设计的系统可用于家庭、敬老院等室内场景进行陪护任务。具体开展了以下工作:第一、对智能陪护机器人进
人脸表情合成在人脸识别、动画制作、人机交互等领域有着广泛的应用。然而,由于面部表情的非线性变化,表情合成是一个具有挑战性的任务。生成式对抗网络在图像合成任务上表现出的优越性一定程度上解决了传统方法存在的问题。现有的方法主要是针对表情类别进行合成,但缺乏对表情强度的细粒度控制。本文主要针对表情的不同强度进行研究,基于生成式对抗网络合成具有不同表情强度的真实感人脸图像。本文主要提出了两种方法:1)融合
近年来,机器人及人工智能技术飞速发展,在诸多应用领域体现了巨大的应用前景。自主导航能力是移动机器人深层次应用的基础,而机器人的实际运行环境中往往或多或少的存在不确定因素,如地图未及时更新或临时出现的人或物体等,因此,机器人对环境的适应能力也至关重要。同样发展迅猛的深度学习技术,使机器人具备自主学习能力成为可能。本文研究了移动小车的避障和自主导航技术,其运行环境的二维示意图已知,且其中存在不确定的障
随着科技的不断发展,信息安全事件的频发引发了大众对于保密通信技术的重点关注。传统通信方式存在保密性漏洞、容量限制、攻击保护低效、设备成本高等问题。而混沌系统具有高度的随机性、非周期性和不可预测性,新型混沌通信系统具备高容量的动态存储能力及相对较低的设备成本,显示出了明显的技术优势和广阔的应用前景。本文针对几类分数阶混沌系统,设计了新型完全同步及广义同步控制策略,并对其进行了保密通信应用研究,主要工
近年来液化天然气工业发展极其迅速,铁路运输是LNG最经济、高效的运输方式,为此,中车集团某公司研制了铁路运输专用LNG储罐箱。为确保LNG铁路运输的安全,需要在铁路运输专用LNG储罐箱上设置LNG罐箱工况采集装置,并通过无线网络集中收集工况数据,对LNG储罐进行实时监控。本文详细分析了课题关键技术的国内外发展现状,结合LNG铁路运输的实际情况,研究并设计了LNG储罐车储罐工况参数监测系统。该监测系
驾驶机器人结构灵活、能够适应不同类型的车辆,本文在课题组对无人驾驶机器人车辆横纵向协调控制研究的基础上,为了能够了解被操纵车辆动力学特性的前提下,更好的操纵不同类型的车辆,研究了驾驶机器人车辆的纵向动力学特性学习方法与纵向动态控制。首先,介绍了驾驶机器人的性能指标。并分析了驾驶机器人换挡机械手、驾驶机械腿的结构特征。在此基础上,建立驾驶机器人各机械臂的运动学与动力学模型。接着,介绍了驾驶机器人车辆
视觉里程计(Visual odometry,VO)是通过视觉传感器来获取运动物体的位姿的一种方法,在自动驾驶、机器人自定位和增强现实等方面发挥了重要的作用。由于其低廉的成本和广泛的应用场景,近年来成为视觉领域一个讨论和研究的热点。基于几何法的传统视觉里程计十分依赖特征的选取和匹配结果,并且单目VO还存在尺度不确定的问题。而随着近年来深度学习的兴起,深度神经网络在各种视觉任务中都得了不错的成果,因此
随着社会生产的飞速发展,物流与仓储在供应链中的地位日益提高,传统仓储行业仍存在自动化水平低、功能单一且落地成本高等不足。自动化仓储技术通过计算机信息管理和电气控制,可以有效地完成货物自动存取作业,货物库存的高效管理,对降低物流与仓储成本,提高运输效率具有重要的意义。本文主要研究自动化仓储系统调度优化方法,主要包括基于条码识别的A-ABC货物分类法、货位分配调度优化算法等。本文主要工作及成果如下:(
视觉里程计是无人车导航领域的研究热点之一,它是利用装载在移动机器人上的一个或多个相机采集到的图像信息,对其自运动进行估计的过程。其中单目视觉里程计仅利用单个相机的图像信息,有着低成本、易配置、结构简单以及计算效率高等优点,成为了研究的热点。而近年来深度学习已广泛应用于计算机视觉任务中。因此本文结合深度学习,对单目视觉里程计进行研究。首先,针对深度神经网络中由于深度神经网络在网络层数较深产生的梯度消
在机器学习中,将不同类别的样本数量存在显著差距的数据集认为是不平衡数据集。当代表一个类别的样本数量远低于其他类别的样本数量时,这一个类或多个类在数据集中的代表性可能不足,就会发生类别不平衡问题。然而,为了提高准确性或者最优化相应的代价函数,正确预测多类实例的规则将会收到更大的权重,因此标准的机器学习算法通常偏向于数量多的大类,从而忽略了少类样本,导致小类样本比大类样本更容易被误分类。事实上,从应用