【摘 要】
:
得益于近些年来算力的巨大提升和训练数据的飞速增长,深度学习成为了计算机视觉领域诸多任务的主流算法。然而收集一个大规模、有精确标记的数据集成本非常高昂。一方面,一些
论文部分内容阅读
得益于近些年来算力的巨大提升和训练数据的飞速增长,深度学习成为了计算机视觉领域诸多任务的主流算法。然而收集一个大规模、有精确标记的数据集成本非常高昂。一方面,一些数据集的标记工作需要用到专家的知识,另一方面,通过网络可以很方便的收集数据构建一个含有噪音标签的数据集,但是这些噪音同样会使网络产生严重的过拟合现象,从而使网络的准确率急剧下降。因此,寻找一种高效并且鲁棒的算法来处理带有噪音标签的数据集,将非常具有研究意义和实际应用价值。本文将基于深度学习网络模型探索噪音标签问题,主要工作包括:1.标签带噪的单标签图像识别研究。单标签图像识别问题是噪音标签领域最重要也是被研究最多的课题。目前很多现有的方法需要用到额外的辅助信息,包括不含噪音的额外数据集辅助训练和真实的噪音分布矩阵等。另外,很多基于设计更鲁棒损失函数的方法在真实世界的数据集上表现不够优秀。因此,本文提出一种名为PENCIL(probabilistic end-to-end noise correction in labels)的端到端框架,它会同时更新网络参数和噪音标签。PENCIL可以用于任意的网络结构并且不需要干净数据集的辅助或者关于噪音的先验信息。因此,PENCIL方法比之前的方法更加鲁棒并易于使用。实验中,在各种不同的数据集中,相比之前的方法PENCIL可以使网络性能得到显著的提升。2.PENCIL的抗噪原理及拓展应用。PENCIL采用标签概率分布来监督网络训练并且在每一轮训练中都通过反向传播来端到端的更新这些标签分布。所以整个更新过程将非常关键,PENCIL框架中分类损失函数的选取将会产生很大的影响。本文提出一种反向的KL散度,它与之前方法中用到的损失函数并不相同,但是在处理噪音标签的过程中更加鲁棒。接下来,本文证明反向的KL散度确实比原始的KL散度和均方误差函数更加适合PENCIL框架。最后,基于PENCIL的抗噪原理,本文提出一种新的训练方式,通过多次重复使用PENCIL框架来使网络性能获得显著的提升。3.标签带噪的多标签图像识别研究。相比单标签图像识别任务中的噪音标签问题,在多标签图像识别任务中整个问题会变得更加复杂。因此,原始网络在仅使用sigmoid函数的情况下太过简单而不足以处理该问题。而本文提出的PENCIL框架会基于网络提供的预测来纠正噪音标签,所以一个多标签分类性能更好的基础网络将非常重要。因此,本文提出一种名为Attention的模块去替换原始基础网络中的全局平均池化层来增加网络的性能。Attention模块可以用于任何网络,这保留了 PENCIL与网络结构无关的优点。在实验中,不同规模的网络在使用Attention模块之后,在多标签分类问题上性能均得到显著的提升。而在使用了 Attention模块的基础网络中,PENCIL框架也可以有效的处理多标签问题中的噪音标签。
其他文献
频率是反映系统运行品质的重要参数之一,当电力系统平衡被打破,电力系统的频率就会出现偏差。本论文简要介绍了互联电网仿真模型,分析了两区域波动情况下互联电网运行点的变化,联络线的交换功率偏差与扰动位置点的关系。通过频率波动原理分析,对一次调频和二次调频建立仿真模型,仿真结果分别验证了一次调频和二次调频的调节特性。由对经典两区域模型的仿真,经衰减曲线法整定得到PID控制器较理想的调节参数,仿真结果表明具
随着能源问题的日益严峻和现代科技的进步,对作为能源储备器件的锂离子电池的要求也越来越高。传统商业化石墨负极由于容量偏低,倍率性能差,已经难以满足快速发展的新能源汽车和便携式电子器件等领域的要求。二氧化锡和锰氧化物具有高的理论比容量,丰富的资源,并且绿色环保,已经被广泛研究,并被看作是替代石墨成为下一代锂离子电池负极材料的最佳选择。但是这两种氧化物都有着严重的体积效应,随着充放电的进行,材料会出现明
锂离子电池已被证明在大型储能设备和电动车辆等应用中极具潜力。锂离子电池的钛基电极材料由于其强亲水性和胀气现象而在应用过程中面临重大挑战。另一方面,硫作为锂硫电池的正极材料,具有优异的理论容量和高能量密度,因此被认为是极具发展前景的二次电池正极材料。然而,通过硫还原生成的长链多硫化物(Li2Sx,x=4至8)极易溶解到电解液中,长链多硫化物的溶解将导致活性材料的大量损失,并且金属锂表面上的Li2S和
随着科技的进步、时代的发展,具有特殊性质、优异性能的材料日趋增多。尤其是在2004年,英国曼彻斯特大学物理学家安德烈·盖姆和康斯坦丁·诺沃肖洛夫用微机械剥离法成功获得
随着照明行业的发展,高效环保的大功率白光LED光源成为新的热门研究方向。涂覆技术是LED封装过程中重要一环,荧光粉胶涂覆是否均匀一致直接影响LED的发光效果。但是在实际涂
随着人们信息安全意识的增强,生物特征识别技术已成为了身份认证的一种重要手段,其中指静脉认证以其独特的优势吸引了广泛的关注,指静脉识别技术也因此得到了快速的发展。但
随着科学技术的发展与进步,自动泊车系统逐渐出现,有关自动泊车系统的研究也越来越多。然而在自动泊车系统中,目前大多采用大型单个机器人来搬运车辆,多机器人协同搬运单台车
众所周知,在人类社会工业化进程中,过量的CO2排放恶化人类居住的环境。钢铁行业中CO2排放量占总排放量的15%,其中高炉炼铁过程是主要CO2排放源;且这一问题随着近年来我国钢铁
淀粉是自然界中广泛分布的一类物质,被应用于食品工业中,但糊化后的淀粉易发生老化,影响淀粉类食品的品质和实用价值。添加小麦纤维可以提高淀粉基食品的膳食纤维含量,改善小麦淀粉凝胶的理化性质。本文以小麦纤维为对象,主要研究小麦纤维对小麦淀粉糊化和老化特性的影响,利用蒸汽爆破对小麦纤维进行改性处理,观察原小麦纤维和改性后的小麦纤维对小麦淀粉凝胶特性的影响,为小麦纤维在淀粉类食品中的应用和膳食纤维强化食品的
随着城市规模的不断扩大和科学技术的不断发展,城市路灯照明的科学化管理已经成为城市建设的一项重要内容。为了积极响应节能减排的国家发展战略,推动城市数字化发展,提高城