论文部分内容阅读
随着CPU设备对深度学习算法的需求,网络模型的参数量以及运行速度成为了制约深度学习算法在普通设备上部署的难点,现有的网络大多较为臃肿,无法满足CPU设备的使用条件。因此如何使得深度学习网络更加的轻量化、高效化愈发成为深度学习领域的热门。本文主要研究重点为如何设计一个参数量少、精度高的基础网络,来实现无GPU设备的实时的高精度的人脸识别。本文的主要工作内容如下:为了降低模型的大小、提高网络的运行速度,因此对原始的MobileNet V2网络结构进行精简,使其具有轻量、高效、低内存访问消耗的特点。首先丢弃了原始网络中的不必要的残差块,来降低网络的卷积层数和网络的参数量。然后通过降低原始网络卷积通道的扩张速度,来降低网络的内存访问量,以及提高网络的运行速度。为了进一步增加网络的运行速度,降低了残差结构中的扩张系数,修改了在通道扩张时的扩张方式,使其按照并行扩张的方式,使网络具有较小的内存访问成本,增加实际的运行速度。最后为了使得网络的精度高,采用了空间可分离卷积与深度可分离卷积特征进行融合的方式,使二者在特征上可以进行相互弥补。并且采用了Arcface loss来代替原有的SoftMax loss,通过增加对网络的约束能力使得网络提取的特征更加具有可分性和鲁棒性。通过采取以上策略让基于MobileNet V2改进的LE-Net网络实现了同样训条件下网络模型尺寸降低为2.3MB,LFW的测试精度为99.53%,模型速度是MobileNet V2的五倍。最后以LE-Net为基础,设计了一个实时的轻量且高效的人脸识别系统,该系统包含人脸检测部分、人脸裁剪以及标准化处理、人脸特征提取和对比、人脸注册与删除、系统设置等功能模块。人脸的检测采用了MTCNN五点人脸检测算法。识别的算法是采用LE-Net作为特征提取网络,并采用余弦度量,来作为系统的特征对比方式。在英特尔酷睿i7-4790 CPU上,该系统在部分Megaface和CFP-FP数据集上测试的平均运行速度为75ms,精度分别为99.20%和89.27%,实现了低内存消耗的条件下,实时的进行人脸识别。算法在普通CPU设备上的实验结果,验证了算法的有效性。