论文部分内容阅读
随着互联网和人工智能的快速发展,人脸检测作为计算机视觉的一个重要方向,一个和人们生活紧密相关的研究方向,已经引起众多研究人员的广泛关注。人脸是人体最重要的生物特征,利用计算机智能地检测人脸,并将检测结果进一步处理,能使人们的生活更加便捷化、安全化和自动化。人脸检测技术在近几十年内取得了突破性的进展,其相关的产品和技术也广泛地应用到各行各业中。比如,将人脸检测技术嵌入到摄像机中,能实现人脸自动定焦的功能;嵌入到美颜相机中,能更加精准地定位出人脸需要美化的位置,达到自动美颜的效果;嵌入到城市的车站、海关、机场等地安置的摄像头中,有助于检测和追踪犯罪分子,从而加快公安破案,保证市民安全。但自然场景下的图像通常存在灯光、遮挡和姿势等影响因素,这些因素降低了人脸检测系统的性能。经过多年的研究,大部分算法能够较为准确地检测到图像中正面朝前的人脸,但自然场景下的非正脸,如侧脸检测问题,仍是一个具有挑战性且尚未彻底解决的难题。本文对自然场景下侧脸检测的相关问题进行了深入的研究,包括收集和标注侧脸数据集、分析目前主流算法在侧脸数据集上的检测效果、研究训练图像的人脸边界框内有无耳朵对训练出的侧脸检测器性能的影响。最后基于这些研究,利用集成的方式设计并实现了一个高性能的侧脸检测器。人脸数据集是人脸检测技术中最重要的环节,虽然目前已经存在大量的人脸数据集,但尚未发现可用于侧脸检测的基准数据集。因此,本文通过搜索互联网上自然场景下的图像,并手动筛选和整理出包含侧脸的图像形成了一个侧脸数据集:celian4034。此外,本文使用的人脸数据集还包括360face、celian200、LFW和FDDB。为了更加全面地对人脸检测问题进行研究,本文将所有数据集中的人脸区域以矩形框的形式进行了标注和校准。在分析目前主流的人脸检测算法在不同类型的人脸数据集上的检测效果时,本文使用人脸检测算法Viola&Jones、LAEO、DPMbaseline和CNNFD分别在人脸数据集LFW、FDDB、celian4034和360face上检测。LFW和FDDB代表正脸数据集,celian4034代表侧脸数据集,360face代表多角度人脸数据集。通过比较和分析检测结果可以发现,这些算法在非正脸数据集上的检测效果却较差,尤其是检测率极低,这表明自然场景下的侧脸检测是一个尚未完全解决、且十分具有挑战性的问题。在训练人脸检测器时,标注的人脸边界框是否应该包含耳朵信息,这对训练出的侧脸检测器性能的影响尚未被人们所研究。本文利用目标检测框架Viola&Jones、DPM和Fast R-CNN分别基于celian4034数据集、两种类型的人脸边界框:脸部不含耳朵的人脸边界框和脸部包含耳朵的人脸边界框,训练出6个不同的侧脸检测器。通过对这些侧脸检测器的检测结果进行比较和分析,可以发现训练图像的人脸边界框包含耳朵可以提高训练出的侧脸检测器的性能,此外,还发现DPM和Fast R-CNN框架比Viola&Jones更适合训练侧脸检测器。基于上述实验结论,本文使用DPM和Fast R-CNN两种框架分别在数据集celian4034,以及包含耳朵的人脸边界框上训练出2个不同侧脸检测器,并集成其检测结果。在集成时采用了多种融合策略:删除小框处理、NMS处理和去重叠处理。最后,将集成算法与集成前的算法,以及多个主流的人脸检测算法进行比较。实验结果显示,该集成算法在正脸数据集和侧脸数据集上都具有良好的检测效果,和集成前的人脸检测算法DPMcelian10、FRCNNcelian相比,集成后的算法在准确率和召回率上都有所提高。和人脸检测算法Zhu et al.、DPMbaseline、CNNFD、Face++相比,集成算法获得了最高的检测率。本文收集的人脸数据集,对人脸检测现状的大规模实验分析,以及耳朵对训练得到的侧脸检测器性能的影响研究,对人脸检测的发展具有一定的参考价值和指导意义。最后,本文以集成方法设计并实现了一个高性能的侧脸检测器,这一研究成果改善了自然场景下的侧脸检测效果,对自然场景下的侧脸检测研究具有积极的影响。