基于级联卷积神经网络的人脸检测方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户：zhchbetty

【摘要】

：

人脸检测是计算机视觉领域被广泛研究的课题之一。近年来，深度学习在计算机视觉、语音识别、自然语言处理、多媒体等诸多领域都取得了巨大的成功，卷积神经网络作为一种深度模型

【作者】

：

龙果阳

【机构】

：

武汉理工大学

【出处】

：

武汉理工大学

【发表日期】

：

2016年01期

【关键词】

：

人脸检测局部特征级联卷积神经网络检测准确度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人脸检测是计算机视觉领域被广泛研究的课题之一。近年来，深度学习在计算机视觉、语音识别、自然语言处理、多媒体等诸多领域都取得了巨大的成功，卷积神经网络作为一种深度模型，被广泛地用于解决计算机视觉和模式识别领域中较为复杂的人脸识别、目标检测、图像分类等问题。目前有众多基于卷积神经网络和深度卷积神经网络的人脸检测方法提出，但由于卷积神经网络，尤其是深度卷积神经网络，其网络结构通常较为复杂而且需要大量的数据样本进行训练，在计算资源有限的条件下难以进行。针对上述问题，本文采用了一种级联的卷积神经网络用于人脸检测，能够使用相对少量的训练样本在普通计算机上完成网络的训练，并达到了相对较好的检测效果，能够完成人脸的快速检测。本文的主要工作包括以下几个方面：　　1)对Li等人在2015CVPR提出的CascadeCNN进行网络结构的简化和优化，设计了一个三级级联的卷积神经网络用于人脸检测。本文所设计的级联网络保留了CascadeCNN中3个用于区分人脸和非人脸的二分类网络，去除了需要大量样本训练的3个用于检测框校正的多分类网络。参照AlexNet对第三级网络结构进行调整，并将归一化层的归一化区域设置为5×5。第二、三级网络均使用了多分辨的网络结构，其中第二级网络的全连接层与第一级网络的全连接层相连接，第三级网络的全连接层与前两级网络的全连接层相连接，实验表明与单分辨率网络结构相比，多分辨率的网络结果能够在相同召回率下产生更少的误检框。　　2)针对训练样本设置多组不同的训练参数对网络调优，完成了级联网络的训练。与目前常见的基于深度卷积神经网络的人脸检测方法使用百万、千万级别的训练样本相比，级联网络仅使用了约20万的训练样本。对每一级网络设置不同的学习速率、批大小、迭代步数等参数进行训练，选择性能最佳的网络。实验表明，由于级联网络的每一级网络结构相对简单，训练样本数量相对较少，仅使用CPU便能完成网络的训练。　　3)使用公开人脸测试集FDDB、AFW对级联网络的检测性能进行评估，并详细分析了评估结果。级联网络在FDDB上的召回率为77.43％，在AFW上的平均准确率为76.02%。结果表明，级联网络达到了相对较好的检测效果，但与目前最优秀的人脸检测方法在检测性能上还有一定的差距。针对评估结果进行实验分析，发现级联网络能对大部分自然条件下的人脸完成精确的检测，但对于模糊程度较高、遮挡较为严重的人脸的检测还存在不足。此外，级联网络实现了快速的人脸检测，在未进行代码优化的情况下，使用CPU检测一张640×480×3的图像平均耗时为511ms。　　4)为了进一步加速网络的训练，将LBP局部特征与级联网络进行结合。LBP特征描述了人脸的局部纹理信息，实验表明，与原始图像作为每一级网络的输入相比，LBP特征作为网络输入其内存占用更小，对应网络包含的参数个数更少，网络的训练更为快速。在检测性能上，通过对比实验发现，LBP作为一种局部特征容易造成全局信息和上下文信息的丢失，对于复杂条件下的人脸检测，使用LBP特征训练的级联网络其准确率要略低于原始图像训练的级联网络。

其他文献

基于HVS特性的视频质量评估方法

数字视频压缩和传输技术会对图像造成不同程度的失真,因此视频质量评估在视频压缩、处理以及视频通信领域都具有非常重要的意义,尤其是自动化质量评价技术在各个应用场合扮演

学位

人眼视觉系统无参考视频质量评估感兴趣区域纹理分析运动加权

Web资源质量模糊评测系统研究

Web信息源质量是Web应用成功的关键。高质量的Web信息源在社会、经济、文化等领域的重大决策中都发挥着重要的作用。Web信息源质量受到诸多因素的影响,使Web信息源具有开放性

学位

FTOPSISFAHPFDEAWeb信息源质量评测

基于客户满意度的Web服务个性化组合研究

近年来,电子服务从局部化发展到全球化,从B2C (Business-to-Customer)模式发展到B2B (Business-to-Business)模式,从集中式发展到分布式。Web服务作为一种新兴的Web应用模式,

学位

Web服务组合基于案例的推理客户满意度偏好个性化

基于多核的网络安全测试设备的通用框架设计

多核通用框架是在研究了Tilera多核开发系统的体系架构,分析了传统框架模型的特点与不足,结合多核编程模式的优势等基础上提出的。本文课题以TILExpress-64开发板作为硬件平

学位

通用框架多核编程模式TILExpress-64开发板测试设备

基于构件的组态建模工具的设计与实现

随着计算机科学技术的发展，基于模型驱动的分层建模技术与层次划分方法广泛应用于计算机领域系统高层功能行为的建模，软件复用技术更是伴随着软件系统的复杂规模应运而生，软件构

学位

分层建模软件构件代码生成模型仿真

网络舆论领袖培育关键技术研究

随着网络应用的快速发展,网民素质良莠不齐,网民的舆论对人们的生产、生活产生了重要影响,甚至严重影响到社会的安全稳定。网络舆论环境既需要人们正确的接收到事实真相,又需

学位

网络舆论领袖评价方法筛选模型属性矩阵法阶梯式评价法

基于LBS的城市智能泊车系统研究与设计

随着互联网技术飞速发展，以及移动通信3G网络的建设，一些原本只能在互联网技术下使用的业务正逐步向移动互联网渗透。基于LBS的互联网服务是社会信息发展的趋势，LBS服务是测绘、

学位

AndroidLBS服务定位地图智能泊车

基于网页分块的主题爬虫方法研究

随着网络上信息的爆炸式增长,普通搜索引擎的查询结果越来越不能满足用户查询的需要,尤其是那些查询特定信息的不同领域、不同背景的用户,因此适应特定主题和个性化搜索的垂

学位

主题爬虫隧道分类器网页分块类间转移概率

基于击键特征的身份识别研究

随着信息技术高速发展,人们对信息安全的需求也在不断的提高,身份识别技术正受到更多的关注。传统识别技术由于其固有的不足,已经难以满足人们日益增长的安全需求,生物特征识

学位

生物特征识别击键识别压力感应击键压力融合

基于工作流的合面预算管理系统设计实现

在高度信息化的当今社会，随着市场经济的不断深入，企业规模的不断扩大，企业内部的组织生产方式以及管理方式产生了比较大的改变。为了应对这种前所未有的挑战，在竞争中立于不败之

学位

全面预算管理工作流技术面向服务架构系统集成

基于级联卷积神经网络的人脸检测方法研究

其他学术论文