论文部分内容阅读
本论文主要研究结合视频的平面图像人脸检测和定位的问题。在目前的人脸图像信息处理领域中,包含有人脸识别、人脸跟踪、姿态估计、表情识别等多个方向,而人脸检测是它们的前端课题。因此,对于一个完整的人脸信息分析系统来说,人脸检测的算法是必不可少的。人脸检测方法研究己经有二十多年了,然而,到目前为止,由于人脸检测问题本身的复杂性(包括人脸模式的多样性,即人脸表情丰富多变、光照条件不同等等都给人脸检测带来极大困难)以及不可预测的因素太多的原因,众多研究人员均未给出人脸检测问题的彻底解决方案。本文结合研究生阶段所参加的科研项目,对人脸检测问题作了一些探讨,提出了基于运动检测、肤色分割的粗检测与神经网络、模板匹配的精定位相结合的人脸检测与定位算法。本文的主要工作:(1)运动检测和肤色分割。运动检测利用视频信号中人会运动的特点找出运动区域;肤色分割利用已建立的肤色模型分割出图像中的肤色区域,然后对肤色区域进行一系列的预处理,可以将大幅的待测图像分割成若干小的待测图像,缩小搜索范围,减小运算量。(2)模板匹配。针对模板匹配计算速度慢,无法满足实时性的弱点,提出了二值模板匹配的一种应用方法,即将待测图像通过阈值进行二值化,然后和二值模板进行逻辑运算的方法,大大降低了运算复杂度,提高了运算速度。(3)神经网络。利用神经网络多记忆、多输出的特点,提出了运用BP网络将人脸检测和眼睛定位相结合的算法和数据结构,避免了BP神经网络会陷入局部极小点的弱点。虽然含有巨量节点的神经网络的训练消耗了大量的运算时间,并且实时性也会受到一定影响,但是由于其单向的数据运算方向和单一重复的运算方式,使得整个系统向FPGA移植的目标成为一种可能。由于实时运算的需要,本文将多种检测方式结合进了Bayes神经网络,利用它们之间的相互约束,提高了检测的成功率。