大数据平台用户日志采集与实时监控系统的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:BarDy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在移动端设备与应用飞速发展的当下,各类互联网服务大数据平台繁荣发展,大数据平台上的海量用户会产生大量的日志数据。如何对系统端与终端分散的海量用户日志数据进行采集与实时监控,实时关注日志中的各项重要指标,成为大数据平台企业所必须要解决的问题。通过对日志数据的监控,可以即时了解企业大数据平台的设备系统情况,对可能发生的故障进行检测和排查,可以优化业务流程,为平台用户提供更好的服务。目前大数据平台在用户日志处理方面面临如下几个主要的问题:(1)需要更符合企业实际业务需求,如保证高吞吐量、可靠数据传输等特性的系统,完成对日志的采集、清洗和存储工作;(2)对实时日志数据的接入管理不便,难以对日志历史数据进行简易有效管理,从而影响到上层数据查询和统计分析计算效率;(3)当前通用实时监控告警业务开发联调周期较长,需要一个系统工具来实现灵活、高效的日志数据监控任务。本文首先阐述了日志采集与实时监控系统在当前大数据环境中对于大数据平台企业的意义与相关应用,然后从大数据平台企业对用户日志数据采集和有效监控的需求出发,探究分布式的日志采集与实时监控系统架构所必需的原则特性;接着设计了系统的功能架构、技术架构和网络架构,并进行了系统所用开发工具的技术选型。最后对系统的各个模块功能进行详细阐述,结合系统的架构与详细设计实现了日志采集与实时监控系统。系统总体可分为后台日志数据采集、清洗和存储部分以及前台用户日志管理和监控部分,其中前台部分可分为作为基础的连接管理模块、进行日志数据接入和数据管理的Druid数据源配置模块、以及进行监控任务、监控脚本创建的监控任务配置模块。本文所涉及的日志为应用系统通过日志策略定义的自定义日志,后台数据处理组件可完成日志数据采集、清洗和存储的整体流程,同时开发人员可通过该系统前台Web端将日志数据从Kafka消息系统接入到实时计算引擎Druid并管理,以供后续监控任务或实时查询;对于接入的日志数据可进行日志监控任务的创建,生成监控脚本并部署到Airflow工作流平台,完成对实时日志数据的周期性查询与告警工作。本文使用线上测试环境对日志采集与实时监控系统进行测试,达到了预期的设计目标。本系统已在国内某大型互联网企业的大数据平台上线,系统较好实现了分布式环境下对用户日志数据源的管理,以及对用户日志实时监控任务的有效配置,方便的满足了企业开发人员对于用户日志数据管理与实时监控的业务需求。
其他文献
永泰县采取“七抓七保”稳定发展粮食生产 永泰县为了确保今年粮食总产稳中有增,便采取“七抓七保”的办法。即:(1)抓计划,保面积。严禁弃耕抛荒和粗耕滥管,稳定粮食播种面积
去年9月19日,美国《时代》周刊网站上,9月28日的杂志提前出现,除美国主刊外,其亚洲、欧洲和南太平洋版封面主角皆为中国:金边红心的五角星占据整个封面,"中国时刻"的字样嵌在
本工艺采取5,6-二甲氧基-1-茚酮为原料,经过缩合、还原、苄基化和成盐四步反应进行了盐酸多奈哌齐的合成,总收率达72%,优化了经典的德国拜耳公司的合成工艺。该工艺原料易得,
总结了东海县实施测土配方施肥项目工作成效及做法,并针对存在的问题,对今后继续测土配方施肥工作提出了思路。
利用原子级计算机模拟对四方SrTiO3中畴壁能进行了研究。在经典Born模型基础上用来描述离子晶体的原子级模拟,其能量表达式由长程库仑势和短程排斥势构成。后者为一含参数表达式,式中参数
发发现和定位新的抑癌基因提供线索和依据,应用聚合酶链反应检测了54例喉癌组织中染色体9p21区域D9S319座位的DNA微卫星多态标记的杂合性选择。结果:2例可提供信息的原位癌病例中LOH频率为2/2,44例可提供
林业是我国的一项重要产业,尤其是在我国很多地方,更是防止土壤沙化,保护环境的有力措施。林业育苗技术及管理工作作为林业生态环境建设的基础性工作,有效的落实和实施,对我
针对在不同条件下,谷物有不同的干燥特性,设计了一种薄层干燥试验台。阐述了薄层干燥试验台的工作原理,并对其结构进行了设计。
一、选好菌种是关键。最好选用新育一代良种,传代次数过多的品种,容易引起品质的退化,产量的下降。同时忌用不同型号的草菇菌种混合栽培。 二、妥善处理好培养料。栽培草菇主
新世纪头三年,我省农村户用沼气建设迈出三大步。2001年全省新建户用沼气池15500口;2002年新建户用沼气池40552口;2003年预计新建户用沼气池40000口。合计可新建户用沼气池96
期刊