图片清洗的自动化工具与日志监控的设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户：houzi7731

【摘要】

：

【作者】

：

钟德昭

【出处】

：

北京交通大学

【发表日期】

：

2020年01期

【关键词】

：

数据清洗 Jenkins 流水线 EFK 监控告警

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图片识别算法的应用日趋广泛,而算法模型的训练需要大量的原始图片数据作为模型训练集和测试集。原始数据的质量良莠不齐,异常数据会直接降低算法模型的准确度。为了得到干净、准确的训练数据,数据清洗工作是十分必要的。本文分析了用户的功能性需求,首先满足用户对于干净图片的要求,然后对于非功能性需求,分别在实用性、可靠性、可维护性和可扩展性等方面进行了分析。针对整个系统框架,提出了概要设计,本文工作主要包括两个模块,数据清洗流水线和监控告警系统,其中数据清洗流水线包括数据清洗和数据取用两个子模块,监控告警系统包括日志监控、异常告警和结果展示三个子模块。在概要设计基础上,对于系统五个功能模块进行详细设计,区别于传统数据清洗脚本,本文构建了数据清洗和监控告警的完整系统。其中实现数据清洗环节的算法主要使用Python编写,数据传输环节主要使用shell脚本。以Jenkins任务并行的方式构建流水线。同时使用EFK(Elasticsearch Filebeat Kibana)软件构建监控告警系统。为实现对原始图片数据的清洗和整理,本文基于Jenkins构建了一条自动化流水线,具体包括去重复、去除模糊、去除无题干、倾斜旋转和版面分析五个环节。主要将原始图片集中的脏图片去除,倾斜图片复位,同时识别图片中的各种题型,比如横式、竖式和脱式,根据用户即算法模型构建者需求,将包含其所需题型最多的图片,称为有价值图片,提供给用户作为训练集。一部分种类的脏图片提供给用户作为测试集。为了实现对图片数据清洗情况的时刻把握,本文基于EFK构建了日志监控告警系统,通过对清洗过程日志的搜集,并定时监控,对于清洗出现的异常情况向用户告警,图形化展示清洗效果。EFK会在清洗过程中不断更新日志数据,并生成动态看板,展示实时的清洗效果。系统构建完毕后,分别对功能性需求和非功能性需求的相关属性进行测试,评估其质量是否能满足用户预期。本人负责了流水线的搭建,去除模糊,去重复,去除无题干算法的编写,监控告警系统的部署,以及后期的测试工作。

其他文献

新型冠状病毒肺炎疫情下医护人员医疗器械相关皮肤损伤现状及防护

<正>在抗击新型冠状病毒肺炎疫情中,医护人员穿着透气性和水蒸气穿透性均有限的防护服,反复或长时间地佩戴口罩、护目镜、防护面罩(屏)、手套等,甚至为了避免上班期间不上卫

期刊

医疗器械相关皮肤损伤预防新型冠状病毒肺炎

基于审美教育视野的高校二胡教学改革

如今,随着音乐教育越来越被人们重视与推崇,掌握一门乐器演奏技能已经在学生学习成长过程中不可或缺。目前,由于二胡作为一门独立的音乐学科,其地位愈发重要。经过研究调查发

期刊

审美教育二胡教学改革现状策略

多年冻土地区工程建设生态环境影响研究评述

多年冻土地区工程建设的研究在国际上开展很早,而关于工程建设项目对区域生态环境影响的研究则相对滞后。在对生态环境要素所受影响角度的考察中,相关研究集中于工程建设项目

期刊

多年冻土工程建设生态环境影响生态环境影响评价

文化创意产业的知识产权保护*——以浙江省为例

浙江省文化创意产业蓬勃发展的过程中面临着越来越多的侵权的考验,亟需通过知识产权加以保护。其中,针对动漫产业中的动漫作品以及其中的动漫人物,因其显著的独创性特征,应当

期刊

浙江省文化创意产业知识产权保护

成都平原先秦时期主要考古学文化的墓葬及演变

成都平原先秦时期主要考古学文化包括了宝墩文化、三星堆文化、十二桥文化,不同考古文化的墓葬也分别体现了成都平原不同时期的文化特征和社会状况。不同时期的墓葬也具有独

期刊

成都平原先秦墓葬宝墩文化三星堆文化十二桥文化

医护人员颜面部防护设备相关压力性损伤及预防研究进展

医护人员是新型冠状病毒疫情防控的中坚力量,因佩戴N95口罩等防护用品引起的压力性损伤已引起广泛关注。本文综述了国内外器械相关颜面部压力性损伤及防护的研究进展,以期为

期刊

传染病新出现感染控制人员管理医院防护装置压力性损伤

多机场区域航空旅客机场选择研究

随着社会经济的发展,我国民航业也取得了长足的进步,而机场业作为其不可缺少的一环,其发展也进入了一个新阶段:在长三角、京津冀、粤港澳等大都市区出现了多个机场服务于一个

学位

多机场区域机场选择非理性因素扎根理论

寒从脚下起泡脚有讲究

俗话说，寒从脚下起。随着秋冬季的逐步临近，不少人又开启泡脚养生的模式。尤其是老人若能坚持养成睡前泡脚的习惯，不但有助于提高睡眠质量，还可帮助改善脚部的血液循环，驱除寒冷，促

报纸

给水管道智能套筒设计及其修复漏损管道的试验研究

我国城市经济正处于高速发展阶段,人口增多和用水需求提高为城市给水管网带来的负担持续增长,陈旧给水管道老化造成的城市给水管道漏失率高的问题日趋严重,不仅仅对饮用水资

学位

给水管道智能套筒水激活性材料漏失监测理化特性

戴淑青和解少阳针法临床经验浅析

总结戴淑青教授临床运用和解少阳针法的经验,涵括其理论渊源、治病机制、操作手法及适应证等。和解少阳针法由承淡安先生以伤寒六经辨证为主,结合脏腑气血经络选穴而创;后李

期刊

和解少阳针法通调三焦名医经验戴淑青

图片清洗的自动化工具与日志监控的设计与实现

与本文相关的学术论文