论文部分内容阅读
随着视频压缩技术、计算机及网络的发展,产生了海量的视频,如何对大量视频信息进行有效检索逐渐成为人们研究的热点。视频镜头分割作为视频检索的基础,对其研究具有重要意义。目前常用的视频镜头分割技术大多是基于视频中相邻两帧的简单差分法进行的,很容易受噪声干扰。通过对视频镜头切换方式的分析,采用图分割模型的方法来进行视频镜头边界检测。由于电视广告检测对于减少和杜绝违法广告等有重要意义,所以将镜头边界检测技术应用于视频广告检测。
镜头切换检测主要分三部分:视频图像内容的表达,构造视频流连续信号,连续信号的分类。首先采用了HSV颜色直方图来表示视频图像内容;然后利用图分割模型构造视频流连续信号,采用阈值法对波谷状的区域进行提取,将其作为候选区域;最后利用粒子群优化的神经网络集成对候选区域进行切变镜头边界和不含单色帧的渐变镜头边界区域的提取,对于含有单色帧的渐变镜头边界区域,采用单色帧这一特征进行判别。对103个视频节目独立地进行测试,切变镜头边界检测获得了97.81%的正确率,含有单色帧的渐变镜头边界检测获得了92.31%的正确率,其他渐变镜头边界检测获得了88.89%的正确率。
在前期工作的基础上,本文将镜头分割技术应用于视频广告检测中。通过分析广告的两个基本特点:镜头切换比较频繁和经常突显商标信息,进行了初步的检测研究。镜头切换频率较高的初步判定为广告,否则判定为非广告。对于镜头切换频率很低的广告,通过文本检测的方法进行广告商标信息的检测。初步建立了一个视频广告检测系统。对三段视频节目进行了测试,获得了81.11%的总正确率。
对于镜头切换检测来说,切变检测已经取得了较好的效果,但是对其它渐变镜头检测的效果还不是很理想。日后工作的要点将集中在渐变镜头边界的检测。