分阶段知识蒸馏策略与使用助手模型进行知识蒸馏方法的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lpc123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在近些年中,深度卷积神经网络有了迅速的发展,它已经应用于多个领域,包括图像分类、物体检测、语义分割等等。随着在这些任务结果精度的提升,网络的结构也越来越复杂,占用空间也越来越大。然而,实际应用中,比如应用在手机等设备上,我们往往无法提供足够的计算资源和存储空间给这些重量级的网络模型。所以模型压缩成为了深度神经网络发展的一个重要研究方向,本文研究了一种名为知识蒸馏(knowledge distillation)的模型压缩方法,并提出了两种创新的知识蒸馏形式,取得了领先目前该领域研究水平的成果知识蒸馏的主要思想是使用一个结构简单的学生模型(student)向一个结构复杂的教师模型(teacher)进行学习。通过知识传递过程,让学生模型的结果尽可能接近教师模型,如果可以让这个过程无损失的进行,那么,我们可以认为将教师模型压缩成为了一个小型的学生模型。本文对于知识蒸馏过程进行了详细的实验探究,指出在知识传递过程中起关键作用的是神经网络中进行降采样过后的特征层。同时提出将神经网络进行拆分的方法,分成骨干网络和任务分支网络两部分,指出我们只需要保证骨干网络从老师模型学习到足够的知识,任务分支可以通过骨干网络的结果,进行调整和再训练。并利用这些性质,提出了分阶段进行知识蒸馏的策略。同时,引入一个辅助学生模型进行学习的助手模型(Assistant)来辅助学生模型进行学习。主要思想为,考虑到直接进行知识蒸馏,学生和老师之间可能存在误差,使用助手模型来学习模拟误差的分布,最后在使用数据进行验证时,同时使用学生和助手两个模型进行测试。在助手模型的帮助下,可以对于原本的学生模型进行修正。
其他文献
计算机视觉技术和深度学习的快速发展为打造大规模、无人化养殖农场带来了新的机遇。利用计算机视觉技术实现猪个体识别,以提高猪场的管理效率成为近年来的研究热点。不同猪个体之间脸部特征较为明显,可通过识别猪脸确定猪个体身份,但实际养殖中脏乱的环境为猪脸识别带来很大困难。本文提出了一种基于多尺度卷积神经网络的猪脸识别算法,通过加深网络层数和拓展网络宽度提高了网络对猪脸图像的特征提取能力。利用对称拆分和非对称
随着计算机和自动化技术的发展,越来越多的移动机器人进入人们的生活,服务于社会的方方面面,尤其是在酒店服务、老年护理和医疗保健等行业受到人们的广泛欢迎。导航是移动机器人技术的核心,而定位是移动机器人导航的基本问题,只有准确的定位才能保证服务机器人可靠地完成任务。针对现有移动机器人室内定位方法存在准确性偏低和环境适应性较差等问题,本文采用深度学习结合特征点匹配的方法研究了利用门牌自然路标进行服务机器人
微化学反应器是一种能够通过控制化学反应的流速等方式控制化学反应进程的微型化学设备,可以大大缩短反应时间提高反应效率并且集成化程度高,可以与微小的传感芯片相集成,近年来得到越来越广泛的重视。追踪微化学反应对于表征化学反应进程中的相关参数,如化学反应速率、转化率、平衡常数、最适温度等发挥了很重要的作用。现有的一些方法通常不易与微化学反应器集成,因此不适用于微化学反应中并且无法实现实时在线检测。为了实现
瞬变电磁全波勘探需要记录供电电极或线圈在正向导通、正向关断、反向导通和反向关断时瞬态响应的全过程,需要同步记录不同位置的多组瞬态响应信号。这些信号幅度小,需要高精度、高分辨率、多通道的数据采集系统对瞬态响应进行采集。本文设计了瞬变电磁全波勘探数据采集系统,主要用于地表浅层的地质勘探。以瞬变电磁理论为基础,通过麦克斯韦方程组及电极激发的电磁场的轴对称性设计了势函数,对电极激发的瞬变电磁场响应进行了推
随着人工智能的快速发展,卷积神经网络(Convolutional Neutral Network,CNN)在图像处理,目标检测等领域发挥着越来越重要的作用。然而在很多的时候,使用CPU和GPU在处理这些大数据时存在诸多弊端,存在着速度慢,成本高,功耗大等缺点,无法满足CNN低功耗低延时推理的需求。现场可编程逻辑门阵列(Field-Programmable Gate Array,FPGA)则可以轻松
胸部X光(CXR)图像是诊断肺炎的重要依据,通常需要专业医生或者放射科专家进行解读和诊断。人工解读CXR图像耗费了大量时间和人力,且容易受主观因素影响导致误诊。因此,从CXR图像中自动检测肺炎病灶区域具有重要的实用价值。本文中采用深度学习技术,研究了CXR图像中肺炎病灶的检测方法,主要研究工作如下:1、针对CXR图像中肺炎病灶检测算法精度不高的问题,提出了基于Faster R-CNN的肺炎病灶检测
近些年来,基于视觉的移动机器人即时定位与建图(Simultaneous Localization and Mapping,SLAM)问题吸引了国内外学者的广泛关注。SLAM虽然只是机器人执行众多任务中的一环,但却为机器人运动、导航、娱乐等上层应用提供了自身定位信息,而机器人能够精确的定位是完成这些任务的前提。针对传统视觉SLAM算法中,光照、视点变化导致环境特征提取和特征追踪不稳定从而影响定位精度
本文通过对无模型自适应控制(Model-Free Adaptive Control,MFAC)的研究,分别在控制律的计算优化和针对系统伴随噪声干扰的问题上对无模型自适应控制算法进行优化改进。提出一种基于改进跟踪微分器的MFAC去噪方法和一种基于输出误差变化率来计算控制律的新方法。同时,对每一种方法在数学上都证明了输入输出信号的收敛性。最后,对本文提出的每一种改进的算法都进行了验证,来阐明本文算法的
随着工业生产水平的提高,相关工业过程的控制精度要求也逐渐增高。然而,实际生产中存在的各种不确定性与扰动将直接或间接影响控制精度,进而影响产品的最终品质。本文以自适应动态规划相关控制技术理论为基础,针对非线性系统在各种不确定性和干扰影响下的鲁棒控制问题进行研究。文章主要从理论研究和相关应用场景两个方面进行展开,并针对具体场景进行分析与设计。本文首先考虑了不确定非线性系统的鲁棒跟踪控制问题。考虑非线性
网络数据挖掘在通信网络,交通网络和社交网络在内的许多网络中具有众多应用。网络数据的激增不仅带来了新的机遇,也带来了新的挑战。与网络挖掘有关的许多研究问题中,链接预测具有根本的重要性。预测网络中节点间的关系的问题称为链接预测。链接预测旨在基于当前观察到的链接来预测网络中丢失或未来的链接关系,进而来推断网络链接的形成过程。在社交网络中,社会联系的建立不仅取决于个人的内在兴趣,而且还取决于其邻居节点在人