论文部分内容阅读
近年来,伴随网络、计算机和多媒体等技术的飞速发展,用户可以通过各种有线、无线网络在个人计算机、电视机、智能手机、车载电视等媒介上观看各种数字视频,真正实现了用户能随心所欲地观看各种视频节目,极大地丰富了大众的业余生活。但是,与此同时,面对海量和形式多样的数字视频资源,用户如何找到自己感兴趣的视频片段往往素手无策。对数字视频进行分类组织和管理能够有效地提高视频的检索速度,由于人工分类和语义标注极易受到参与人的主观意识和文化水平的影响,导致分类和标注效率低下,因此,数字视频自动分类的技术成为该领域的一个研究热点。尤其对于体育视频,有效的自动分类和语义标注技术能使教练快速找到相关视频资料,对运动员进行有针对性的指导和训练;对于用户,有助于实现快速找到感兴趣的体育视频节目或片段。因此,体育视频的自动分类技术已经成为数字视频研究领域的一个重要分支。本文在广泛阅读、深入探讨和总结以往体育视频自动分类技术的基础之上,针对目前仅使用单特征,或特征线性组合的方法存在难以刻画不同体育视频的本质差异,而导致分类性能低、鲁棒性差的问题,提出两种新型的非线性特征融合模型,并设计了基于新型特征和支持向量机(SVM)的体育视频自动分类算法,与对应的单特征或线性组合相比,本文提出的算法提高了分类精确度。具体工作如下:第一、对现有的体育视频自动分类技术做出比较详细的分析、总结,给出现有方法存在的优缺点。第二、为了评价本文所提出特征和所设计的算法的有效性,本文建立一个包含网球、羽毛球、乒乓球、足球、台球、网球六大球类的测试数据库,该数据库总共长480分钟,共有953个视频片段。第三、提出了一种新的基于颜色和纹理非线性融合特征的体育视频自动分类算法。该算法在HSV颜色空间上构造一个抽象的一般化的线性量化模型,用一个颜色索引矩阵表示视频帧的视觉内容。并在此基础上计算反映颜色纹理的共生矩阵。该矩阵融入视频帧的颜色和纹理信息,比单颜色、单灰度纹理或简单的组合含有更加丰富的信息,提高了视觉内容表达能力,进一步提高了所设计分类算法的精确度。第四、提出了一种新的基于颜色和边缘非线性融合特征的体育视频自动分类算法。该算法在RGB颜色空间对应的三个颜色通道上,引入度量视频帧内边缘信息的模型,将颜色融入边缘,构造颜色边缘强度和方向特征模型。该特征提高了视频内容表达能力,提高体育视频的分类性能。