论文部分内容阅读
近年来,随着深度学习的不断发展,深度卷积神经网络在各个实际场景中得到广泛的应用.然而,由于训练好的模型参数的保存精度和推理精度通常是32位浮点型,其计算复杂度高、内存占用较大、耗时长等缺点,导致一些精度很高的模型往往很难部署到计算和内存资源受限的边缘设备上去.针对此,本文提出一种将浮点模型量化为定点模型的量化算法,此算法可以在模型训练过程中使用网络学习出特定的层应该采取的量化精度,避免了人为设定量化精度从而导致训练好的定点模型精度较浮点模型精度严重降低的情况.最后结合ASIC神经网络加速芯片进行边缘端部署,证明了算法的有效性.