论文部分内容阅读
数字视频中人体行为的分类与辨识,是计算机视觉领域一个新的极具挑战性的研究方向,自兴起以来,传统的基于运动目标特征提取、运动模板分析等技术的研究,在实际应用中大多都会受到诸如遮挡、光照、尺度,以及个体肢体动作之间的差异等因素的严重干扰,而影响分类与辨识精确度。近期随着深度学习技术的发展,越来越多的基于深度卷积网络的行为分类与辨识算法问世。相比传统方法,深度网络模型在性能方面有较大提升。体育运动中针对竞赛类视频进行战术情报分析,也是随着视频获取设备的不断普及,而显现得越来越重要。本论文利用基于深度网络模型的行为分类与辨识算法,对空手道比赛视频作相应的战术情报分析,大幅度提升了分析效率,以及分析的精确度。本论文的研究分为两个环节:(1)从空手道比赛视频中获取运动员的二维或三维的骨架信息;(2)利用骨架数据构建图卷积网络模型,进行行为分类与辨识。本论文的主要研究工作与创新点:(1)数据集的制作。超大量的采集空手道运动员对抗训练时的数字视频,人工裁剪空手道中踢腿、挥拳,移动三种动作的视频片断,然后,模仿Kinetics数据集制作方式,制作系统使用的数据集。(2)比较研究了三种姿态估计算法,并利用实验分析来判断,本论文中将采用Open Pose姿态估计算法,能为提高行为分类与辨识精确度奠定原始基础。(3)提出一种利用德劳内三角剖分算法,构建深度网络模型中图卷积模型,充分利用了德劳内三角剖分捕捉立体空间结构信息的能力,构建出特征信息更丰富的图模型。通过实验分析了该模型相比较于其它模型,能丰富更多的行为特征,行为分类的准确率较高。(4)针对实际的比赛视频,测试分析了论文的研究成果,在几种战术情报分析中的应用效果。通过与其他算法进行特征对比和模型准确率的对比,本文中提出的算法在该系统中对于行为分类有更好的效果。