论文部分内容阅读
随着人工智能的兴起和深度学习的发展,基于卷积神经网络的人脸识别成为计算机视觉领域的研究热点。卷积神经网络实现了端到端操作,能够自动提取图像特征。然而,在硬件计算资源受限的特定情况下,卷积神经网络难以得到很好的训练,不能在人脸识别中有效发挥作用。为此,本文分别对AlexNet和VGGNet分析并构造一个合理的网络结构,以提高训练效率、降低原网络苛刻的硬件要求。全文主要内容包括:(1)总结卷积神经网络基本理论知识,介绍了Caffe框架。以LeNet网络为例,详细介绍了卷积神经网络的结构及各层次原理。最后对网络的正向传播、反向传播过程进行了理论推导。(2)针对硬件计算资源受限的特定情况,提出了基于改进AlexNet和VGGNet网络的人脸识别。其中对AlexNet改进的方式是用小卷积核叠加模块形式替代原有的大卷积核并减少全连接层数目;对VGGNet改进的方式是减少全连接层数目,增加BN层,并用现有参数对结构进行微调。最后对改进结构在LFW数据集上测试,对比分析表明改进后的结构减少了参数数量,降低了硬件要求,加快了训练速度,对人脸识别率有一定的提高,基本达到预期目标。(3)搭建人脸识别系统。基于Caffe框架和前期训练模型开发了简单的人脸识别系统,实现实时人脸识别和静态图片比对。最终选用非训练数据集在不同情况下测试系统识别率。实验证明系统软件具有一定的鲁棒性,识别率高,满足预期设计的要求。