论文部分内容阅读
体育运动深受人们的喜爱,随着互联网的发展,视频体育爆炸式地增长,对体育视频的分析有很大的市场。而传统的基于人工标注的方法不能满足人们日益增长的需求,因此体育视频分析具有重要的研究价值。针对体育视频分析中的问题,本文主要对基于号码识别的球员自动识别进行研究,本文的主要内容有以下几点:(1)远镜头中球员区域的定位研究。由于远镜头中包含一名或者多名球员的全身像,本文提出利用常用于人的检测的HOG(方向梯度直方图)特征来定位球员。正样本选取能观测到球衣号码的球员正面、侧面和背面像,负样本选取比赛中非球员区域,通过训练SVM(支持向量机)分类器来区分球员与非球员。并且考虑到球员的运动幅度特别大,而人的头部和上身躯干部分比较稳定,实验中,我们用全身像和半身像训练了两种分类器,实验显示,在体育视频帧中,全身像检测具有更高的准确率,而半身像检测具有更高的召回率。(2)近镜头中球衣区域的定位研究。特写镜头中,往往只包含球员的上半身,球衣号码和上方的队名或人名提供了丰富的文字信息,本文首先采用了直接在中间区域检测场景文字的方法来定位球衣上的字符号码。另外,人脸检测技术已经比较成熟,本文创新性地提出一种基于人脸检测和人体比例的检测方法。实验对比证明,基于人脸检测的定位准确率高于基于场景文字来定位的准确率,并且通用性更好。(3)球员的队别判别。由于比赛双方球队的球衣颜色对比明显,本文利用提取到的球员或者球衣区域提取图像的颜色特征,进行相似性度量,判断出球员的队别。本文中选择Hue分量累积直方图作为颜色特征,实验证明与RGB直方图和Hue分量统计直方图相比具有更高的准确性。(4)字符号码分割和识别研究。本文首先对提取的号码图像进行归一化、旋转校正等处理,通过仿射变换来建立模板库,利用KNN(K近邻法)来进行号码的识别。实验证明,对于体育比赛这种特殊场景计算简便、准确率高。以上研究工作对于体育视频的分析提供了一些新的思路,具有一定的参考价值。