基于光流引导特征的多特征融合交警动态指挥手势识别研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lzhonline276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,驾驶辅助系统及无人驾驶技术逐渐兴起,成为研究热点。其中,交警指挥手势识别作为关键技术,受到了研究者的广泛关注。尤其是交警指挥手势实时识别算法的研究,具有重要价值。视频数据不仅承载了静态图像中空间维度的信息,还承载了时间维度的特征信息。因此可以利用帧间运动特征与单帧静态图像空间、颜色、纹理等多种特征融合的方式,提取视频数据中的时空信息,用于交警指挥手势识别。本文设计了一种基于帧间运动特征与多特征融合的交警指挥手势实时识别算法,主要研究内容如下:(1)针对目前交警指挥手势识别领域尚无开源数据库的问题,结合交警指挥手势信号的特点和对其进行识别的任务需求,建立一个包含剪辑视频和未剪辑视频的交警指挥手势视频数据集,用于支持后续识别算法的研究。(2)针对交警指挥手势信号不同视角下相似度高、不易区分以及在实际应用中交警指挥手势不标准的问题,本文选取光流引导特征(Optical Flow guided Feature,OFF)对帧间运动进行描述,从时间维度对帧间运动信息进行描述;从单帧静态图像提取颜色、纹理等静态特征,从空间维度对人物、场景等信息进行描述,提升模型区分不同指挥手势信号的能力。此外,为提升模型对长时间运动信息建模的能力,本文设计了OFF-TSN网络模型,进而利用整个剪辑视频级别的特征,对交警指挥手势进行识别。实验表明,针对交警指挥手势识别任务,OFF-TSN网络模型能够在剪辑视频级别有效提取时空特征并用于识别,模型在自建交警指挥手势剪辑视频数据集上的测试中达到了93.4%的识别率和206 FPS的识别速度,具有良好的性能。(3)本文在OFF-TSN网络模型的基础上,设计了交警指挥手势实时识别算法。针对多尺度滑动窗口采样带来大量数据造成的延迟和漏检问题,本文采用基于SSD的目标检测算法对实时视频中是否存在交警进行检测,控制采样的起止时间;并设计了基于OFF-TSN网络模型的过滤网络,用于过滤缺少手势信息的采样片段。针对指挥手势在实时输入视频中的定位和识别问题,设计了基于OFF-TSN网络模型的定位识别网络,通过改进OFF-TSN网络模型的损失函数,使网络能够对指挥手势信号的完整性做出判断。最后,将定位识别网络与检测采样算法相结合,实现对指挥手势的定位和识别。本文设计的交警指挥手势实时识别算法在自建指挥手势未剪辑视频数据集上的测试中,识别结果与真实标签的归一化Levenshtein距离为0.872,识别速度为26.8 FPS,实现了对交警指挥手势的实时识别。
其他文献
特征选择方法在现如今这个“数字化”时代被广泛的使用,其作为一种数据预处理手段频频出现。此技术旨在既不损害数据的价值信息表述能力,又能急剧减少数据量。准确率一定是特征选择问题追求的永恒主题,同时时间也是一个重要的评判指标,并且随着待解决数据的列数越来越大,问题空间扩大给算法带来很大挑战。本文采用了粒子群演化算法的手段对特征进行寻优选择,对粒子群特征选择算法实现了如下的改进,主要内容如下:(1)本文首
议论文的议论味,就是文章要符合议论文的文体要求。想把议论文写得具有议论味,要从确立鲜明正确的观点、开篇快速切题、选用恰当的论据、灵活运用论证方法、彰显清晰的逻辑等方面着手,只有具备了这几点,议论文才能具备正宗的议论味。
钱选为代表的“新”青绿山水画家,与传统青绿山水画作品相比,不仅吸取前人的设色和笔墨技法,还对青绿山水画的思想表现进行了意象加工与改造,绘画的形式语言也进行了新的尝试,使青绿山水画发展到另一个新高度。钱选青绿山水画的形式语言表现下,在构图上展现了个性化的独特性的形式语言,表现出其青绿山水画厚重、简洁、拙朴的布局形式;在线性语言上,概括提炼出简洁有力的线条,增加画面的古拙之意;在设色形式上,画面以平涂
水下声源目标定位技术在海洋资源的勘探以及海战场中定位敌对潜艇目标不可或缺,其在水声和国防领域的重要性不言而喻。目前,水下声源定位传统方法是将声源信号和建立的声场模型进行匹配,但存在海洋参数未知和环境失配等一系列问题。随着深度学习在各领域的出色表现,根据其不受环境因素影响的特点以及在声信号处理方向的潜在能力,本文基于深度学习提出一种水下声源定位方法。本文主要工作如下:首先针对水下声源信号中蕴含着目标
南水北调项目工程已经竣工多年,渠道的各个涵洞口由于长时间泥沙的自然堆积,包括树枝树叶自然飘落的沉淀还有生物的排泄物的堆积等等,产生渠道的各个涵洞口淤泥的产生,迫切需要一套水下清淤系统清理这些淤泥。在水下清淤系统中,钢缆绞车、电缆绞车、水管绞车分别提供清淤机器人的回收、控制以及淤泥输送,为清淤机器人提供较为重要的辅助,对水下清淤机器人岸上辅助系统进行研究十分有意义。本文对水下清淤机器人岸上辅助系统进
目前,人类行为识别研究在人机交互领域发挥着举足轻重的作用。随着无线网络的快速发展,Wi Fi信号在公共生活中被广泛的普及和应用,使用Wi Fi信号收集人体的移动信息作为一个新兴的研究热点,正得到智能家居,入侵检测等多个领域的关注。使用无线网络收集人体移动信息,具有部署简单、成本低、应用场景广泛等诸多优点。同时Wi Fi信号中的信道状态信息能够被用于分析人体的步态信息,从而为身份认证技术提供有力的数
现如今基于深度学习的目标检测技术取得了巨大进步,在无人驾驶、军事技术、智能疾病诊断、安防系统等领域得到广泛应用。目前基于Faster R-CNN系列的目标检测算法对小尺度目标特征提取较差,对基于旋转边框的目标检测性能偏低。针对小尺度目标和旋转目标的特性,本文提基于改进Faster R-CNN的旋转小目标的检测技术,取得了很好的检测结果。本课题的研究工作主要包含两个方面:第一,本文提出了一种基于改进
计算机硬件的快速迭代和软件技术水平的不断提高,促进了数据三维可视化技术的长足发展。医学体数据的三维可视化技术改变了传统医学诊断的方式,医生不必再对着二维的诊断图像,凭借主观的判断来构想病灶的相关信息,而是能够直接借助三维图像来进行医学诊断和术前规划。这为病患的诊断和治疗都带来了极大的方便。大脑控制着人类的活动,决定着人类的思维,其重要性不言而喻。对大脑的诊断和治疗都需要极其小心谨慎。若仅仅把大脑的
在海洋工程作业中,船舶与海上建筑物间的人员换乘频繁。不同于陆地换乘作业,海上的风、浪、流会严重影响传统换乘方法的安全性。本文针对具有动力定位系统的工程船舶,设计了一款具有主动波浪补偿功能的人员换乘舷梯(简称波浪补偿舷梯),它可以补偿船舶的横摇、纵摇以及升沉运动,能够在较高海况下安全快速地完成船舶与海上建筑物之间人员换乘通道的搭建,有效降低换乘作业对海洋环境的要求并延长换乘窗口时间。本文主要内容包括
文本分类是自然语言处理领域中一个经典而又重要的任务。现有的大多文本分类方法都侧重于文本表示,然后使用机器学习算法或深度学习模型进行分类,但这些方法没有考虑文本间隐含的相互关系。对此,本文构建了两种基于图卷积神经网络的文本分类模型HGCN以及HGCN-BERT,在图卷积神经网络中引入文本异构图和注意力机制,得到数据的全局信息来解决上述问题。HGCN模型通过文本异构图将数据集中的信息转化为拓扑图结构表