基于改进YOLOv3的口罩佩戴检测算法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户：battichen

【摘要】

：

【作者】

：

张琴涛

【机构】

：

天津工业大学

【出处】

：

天津工业大学

【发表日期】

：

2021年01期

【关键词】

：

口罩佩戴检测 YOLOv3 MobileNetV2 空间金字塔池化边缘框回归的损失 Mosaic数据增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

新型冠状病毒可以通过空气中的飞沫、气溶胶等载体进行传播,具有极高的传染性,公共场所自觉佩戴口罩是严防疫情反弹的最有效措施。此外,某些特殊的工作场所（如打磨车间、无尘车间）需要工人随时佩戴口罩进行作业。对于口罩佩戴情况,人工巡逻式的排查费时费力,因此,联合摄像头进行PC端的智能监测成为趋势。目前,大多数口罩佩戴检测算法只关注检测精度,在低性能PC端的检测效率并不理想。为此本课题从判断人脸是否佩戴口罩出发,基于YOLOv3算法的思路,意图探索出一种检测精度高、速度快的轻量型口罩佩戴检测算法。首先,针对口罩佩戴检测轻量高速的要求,在YOLOv3的主体网络下引入基于深度可分离卷积和倒置残差结构的特征提取网络MobileNetV2。通过将标准卷积拆分为逐通道卷积和逐点卷积,大大缩小了网络的参数量及计算复杂度,从而提升了算法的检测速度;通过倒置残差结构实现通道的先升维后降维,丰富了深度可分离卷积提取到的特征信息。其次,在特征提取网络之后引入空间金字塔池化结构实现了全局特征和局部特征的融合,丰富了最终特征图的表达能力,在几乎不增加网络计算复杂度的情况下提升了模型的检测精度。最后,通过改进边缘框回归的损失和数据增强对网络的训练过程进行优化。YOLOv3在训练过程中利用L范数计算边缘框回归的损失,而在评估过程中利用交并比来判断是否检测到目标,这两者存在不等价的问题。因此,本文将边缘框回归的损失优化为与交并比相关的损失函数。此外,本文利用Mosaic数据增强方法进一步提升了网络的泛化能力以及抗干扰能力。本文方法在自行构建的数据集上通过交叉验证的方式进行评估。实验结果表明,本文方法在保证检测精度的同时大大缩小了网络复杂度,检测速度在实验平台上达到125帧/秒,与几种优秀的检测算法相比占据绝对的速度优势。同时本文方法在亮度尺度的变化和遮挡情况下仍具有较好的鲁棒性,对复杂环境下的实时检测具有一定的适应能力。

其他文献

基于语义推理的图文匹配方法的研究

随着人工智能,深度学习越来越多的引人注目,图文匹配就是其中的一项任务。图文匹配任务是指给定一个图像和众多文本内容,要求机器在对图像理解的基础上对图像和文本进行匹配,选出和图片最接近的一段文字。图文匹配涉及语义理解、图像检测与识别、知识推理等相关技术,要求机器以人类的方式来理解图像,这也是人们对人工智能的期望。因此对提升机器人等人工智能系统的智能程度具有十分重要的作用。通常来说,图文匹配任务需要同时

学位

图文匹配计算机视觉自然语言处理常识推理

基于多因素融合和谱聚类分组的LBSN数据分析与服务推荐

随着互联网的发展,越来越多的人喜欢在探索新兴趣点（POI）的同时,使用签到（Check-ins）的方式将其分享给基于位置的社交网络（LBSN）上的其他用户。通过分析用户的签到数据,基于LBSN的推荐算法可以挖掘出用户的潜在行为模式,为用户推荐其可能会感兴趣的兴趣点。但是由于LBSN中包含的兴趣点遍布世界各个角落,从如此多的兴趣点中准确找到用户可能会喜欢的兴趣点是非常困难的。并且面对庞大的数据量,计

学位

基于位置的社交网络兴趣点推荐谱聚类多因素融合协同过滤

基于CBCT图像的自动模拟植牙方法的研究

在种植牙领域,植牙前方案规划具有十分重要的意义,它直接影响着种植手术的结果。基于CBCT数据与三维牙模扫描数据的自动模拟种植牙系统提供一种缺失牙参数计算方法,可以大大提升植牙规划效率,提高手术成功率;还提供一种半自动的种植参数可视化方法,加强了系统的灵活度和可操作性。针对目前植牙规划效率较低的问题,本文提出了一种基于CBCT数据与三维牙模数据的缺失牙参数计算方法,首先对CBCT数据进行基本的三维重

学位

CBCT牙模数据缺失牙估计冠长轴根长轴三维重建口腔可视化

基于场景词分析的视觉问答方法的研究

深度学习已在计算机视觉和自然语言处理两大领域都获得了巨大的成功。视觉问答（Visual Question Answering,VQA）作为横跨计算机视觉和自然语言处理两大领域的引用,是指给出一个语句问题和一个对应的图片,需要智能系统能够理解图片,在此基础上对问题做出回答。随着数据量的爆发式增长,作为视觉问答其中的一个应用,如何根据问题,在一个图集中找到对应的图片,根据图片再给出回答是一个亟需解决的

学位

视觉问答计算机视觉自然语言处理场景词相似度匹配

基于实时三维面部合成的虚拟教师教学系统

在虚拟教学中,授课教师的地位举足轻重,而虚拟教师授课主要通过直观的面部表情传递信息,因此面部合成的实效性至关重要。但传统的面部表情合成方法,存在因驱动复杂拓扑结构模型出现的局部失真、细微表情欠缺现象,因计算量较大带来的延迟现象等。为此本文基于面部高质量建模和面部表情实时驱动两部分关键技术进行了深入研究,有效提升了合成面部的真实性和实时性。在三维面部建模方面,本文在传统纹理映射的基础上针对拼接重合点

学位

特征点匹配面部建模纹理合成面部驱动

基于数据挖掘技术的学生成绩影响因素分析及预测模型

对于当下的学生来说,数据挖掘是一个经久不衰的技术领域,而对于从事数据挖掘的工作者来说更是深刻的体会到了数据挖掘技术强有力的发展前景。本文主要分为两个部分,第一部分主要分析影响学生成绩的因素有哪些,找出对学生成绩影响最为显著的因素。鉴于研究中所用到的数据集维度众多,因此采用一种建立多维数据集的方法完成数据库的建立,其中多维数据信息库里的内容包括学生姓名、学号、身份证号、准考证号、各科目的考试成绩、生

学位

数据挖掘模型建立成绩分析成绩预测算法改进

基于激光熔化沉积的Inconel 625合金复合强化机制及性能研究

Inconel 625高温合金性能优异,被广泛应用于航空航天、工业化工等领域,为了进一步提高其耐磨性能,提出采用激光熔化沉积方法制备碳化钨与石墨烯增强Inconel 625复合材料思路,制备出Inconel 625/WC-12Co复合涂层和Inconel625/石墨烯复合涂层,采用场发射扫描电子显微镜（FESEM）、X射线衍射仪（XRD）、拉曼光谱仪、显微维氏硬度计和摩擦磨损机等对其开展测试,主要

学位

激光熔化沉积金属基复合材料微观组织摩擦磨损Inconel 625合金

基于GAN网络的行人图像修复

近年来随着计算机视觉和深度学习在学术界的快速发展与研究,使得深度学习方法在图像修复、特征提取、图像翻译、图像生成等领域的优势日益突出。深度学习越来越成为研究者们的研究方向。深度学习的方法已经表明极富挑战性的修复任务取得了可喜的成果,这些方法可以生成看起来合理的图像结构和纹理。自2014年Ian Goodfellow等人提出了GAN（Generative Adversarial Network）以来

学位

图像修复生成对抗网络深度学习神经网络色调纠正

基于语音水印的篡改检测与篡改恢复

随着数字技术与多媒体技术的迅速发展,语音信号已成为日常信息传递的主要载体。由于语音信号在传输过程中容易被恶意篡改而失真,如果对语音篡改的内容涉及到国家安全、法庭举证、医学等一系列重要数据,被篡改的语音会给社会造成严重的后果。因此,语音信号的安全问题越来越多引起社会的重视。语音水印作为信息隐藏技术的一个重要分支,通过水印嵌入算法将信息嵌入到语音信号中,可以有效的保护语音信号。语音水印由于其隐蔽性、鲁

学位

语音水印篡改检测篡改恢复双重认证去同步攻击对齐嵌入策略错位嵌入策略

基于机器视觉的鲜枣检测分级方法研究

红枣作为我国的特有果品,得益于中国的气候、土壤和环境等因素,年产量位居世界榜首,同时因其独特的口感和药用价值,受到了越来越多的人的喜欢。近年来红枣产业发展迅猛,但对于采摘后的新鲜红枣的检测和分级还处于初级阶段,为进一步提高鲜枣的产品质量和附加值,应对其进行更加精细化的检测和分级。因此,迫切需要寻找高效、快速的鲜枣缺陷检测手段以及特征分级方法。本论文以天津蓟县大枣作为研究对象来进行鲜枣的检测分级,对

学位

机器视觉鲜枣检测鲜枣分级缺陷检测

基于改进YOLOv3的口罩佩戴检测算法研究

其他学术论文