论文部分内容阅读
视频字幕往往包含了丰富的语义信息,与视频其它特征相比,更适于用作视频索引,因而对于视频字幕提取方面的研究备受关注。 本文针对字幕提取算法开展了研究。为了便于后续的视频分析,提出了一种基于模糊聚类神经网络(FCNN)的镜头突变检测算法,实现视频镜头分割,该算法具有检测精度高、对运动稳健等优点;区域定位是字幕提取的关键一环,同样利用FCNN分类器可实现字幕定位,但其运算量大,定位精度不高,因此提出了一种改进的投影分割方法实现字幕区域定位分割,实验表明其简单实用,适于实时处理;考虑到单个字符背景相对简单,为此提出了一种基于单字符的字幕二值化算法,最终在经由字符分割、二值化及残留背景像素清除之后,得到了清晰、高质的字幕图像,字符识别结果证明了这一点。