论文部分内容阅读
视频镜头边界检测是视频分段、组织、索引的首要步骤,是基于内容的视频检索中更高一级语义、内容分析的基础。本文在总结分析现有的镜头边界检测技术的基础上,深入研究了从视频帧特征选取到阈值选择的边界检测全过程,并在此基础上初步研究视频字幕检测。 总结了视频镜头边界检测中的方法和评价准则,并对各种方法进行比较。对颜色直方图方法进行了深入的探讨,在利用HSV直方图计算出帧间不连续值的基础上,提出一种基于双高斯模型的能同时检测渐变和突变的方法,此方法是对双边比较法采用固定阈值的一种有效的改进,实验证明可以准确快速地定位镜头边界。 提出一种新的基于梯度方向角模值(AM)二维直方图特征的镜头边界检测方法,克服了运动、光照所带来的影响,初步实验结果表明该方法优于HSV直方图方法,并且对渐变边界同样有较好的效果;同时给出了它的改进方法——分块AM直方图方法。提出了一种应用神经网络进行镜头边界分类的无监督聚类方法,此方法大大减少了人工参数对于检测的影响。 综述了当前视频字幕检测的研究成果,并对其中具有代表性的方法进行了分析比较。提出一种基于视频镜头划分的字幕区域检测新方法,在采用AM直方图方法划分出镜头的基础上,充分利用视频特点和字幕特点,通过在镜头内部求运动补偿后的帧间差,再在帧差图上检测字幕区域。初步实验表明,此方法可以准确、快速地检测字幕区域。