基于Hadoop的煤炭企业数据共享平台设计与实现

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:down222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
煤炭在我国能源消费中占有很大比重,而大型国有煤炭企业在我国煤炭生产领域掌握着统治地位,为保障我国的能源安全、经济发展和社会稳定做出了突出贡献。为了提高企业的生产效率、降低企业运营成本、预防煤矿安全事故,煤炭企业纷纷建立了自己的信息化系统。但由于在建设时没有进行合理的规划,不同信息化系统之间数据不能共享,在企业内部形成众多“信息孤岛”。一些煤炭企业为了打破“信息孤岛”,陆续建立起了数据共享平台,但这些数据共享平台无法满足当前煤炭企业信息化系统中的海量数据处理需求。Hadoop是一个分布式系统基础架构,依靠集群的方式在廉价机器上提供高速运算和海量存储。Hadoop使运行和处理大数据更加方便,为解决煤炭企业数据中心存在的问题提供了一条有效的途径。论文通过对于煤炭企业数据中心所面临的大数据处理难题的研究和分析,首先建立了煤炭企业数据共享模型,该模型在Hadoop上建立一个数据仓库,从源数据库按照要求抽取的数据经过数据集成后存储于数据仓库中,通过向外提供统一的数据接口,为用户提供数据访问和数据分析的服务。其次,针对某煤炭企业的实际需求,以该煤炭企业的生产数据为例,完成了数据共享平台的设计。完成了Hadoop平台和服务器端数据模型的设计。对应用Sqoop进行数据抽取的过程进行了阐述。定义了数据清洗和转换的要求和方法。详细介绍了应用的并行FP-Growth算法的算法流程,并设计了几个简单示例应用。最后,对平台功能进行了力所能及的实现。依据设计要求,通过Sqoop将数据从源数据库中抽取出来,放入Hive数据仓库中。Hive和Eclipse集成,在Eclipse下编程实现数据的清洗、转换和加载。应用Eclipse调用Mahout的并行FP-Growth方法进行数据分析,并将结果保存在数据库中。将数据处理结果导入到平台数据库中,并基于Spring架构,在服务器端完成了示例应用的开发。基于Hadoop的煤炭企业数据共享平台,利用Hadoop平台采用成熟的开源的技术,拥有强大的处理能力和高稳定性,不仅提高了实现数据共享的效率,同时可以满足对这些数据进行分析和处理的需求,而且降低了企业数据中心的运营成本。该平台有效的解决了煤炭企业信息系统中普遍存在的“信息孤岛”和海量数据的问题,煤炭企业可以基于此平台进一步开发特定的功能应用,为企业生产经营提供帮助。
其他文献
目前高职教育电类专业的专业基础课数字电子技术课程的教学模式(理论+实践)已经远远不适用于学生的学习,根据社会对高职院校的要求即提高学生的动手能力,本文提出项目引导式教学
随着福州市房地产业的迅速发展和物业管理服务的市场化,对物业管理的制度性建设显得十分重要,《福州市物业管理若干规定》应运而生。该规定实施后,福州市物业管理取得一定成
<正> 自动干手器的功能是,洗手之后,将手伸到干手器下(距吹风口10~15cm),干手器便自动产生热风,很快将手烘干;手一离去,干手器便自动关闭。这种高级卫生洁具可广泛应用在现代
<正>近日在学校的一次教研活动中,笔者抛出了两个关于函数不动点和稳定点的问题:1.设函数f(x)=(x-a)1/2,若方程f(f(x))=x有解,求实数a的取值范围.2.(2013年江西卷理21)已知函数f(x)=a(1-2|
<正>"九·一八"历史博物馆,坐落于沈阳市大东区望花南街柳条湖立交桥北侧,是国内外迄今为止唯一一座全面反映"九·一八"事变史的博物馆。"九·一八"历史博物馆通过陈列大量历
当前证券行业竞争的加剧和利润率的降低,使得成本管理成为证券公司寻求发展的必然趋势,而证券营业部作为基层业务单位,成本管理问题尤为突出。本文针对当前证券公司营业部的
随着21世纪网络时代的到来,如何充分发挥网络技术的优势,将其与外语教学紧密结合在一起,克服传统教学课堂的弊端,摆脱灌输式教学手段的束缚,调动学生语言学习的积极性和主动
<正>"所谓农村电商是指利用网络交易平台,加快农产品输出速度、方便城市商品进入农村市场、推进农村信息化与现代化、推动农村经济发展的新型电商平台。简而言之,就是借助电
近年来,宁波的纺织服装企业凭借体制优势、港口优势和发展基础,技术创新取得成效,但制约技术发展的深层次矛盾依然存在。本文基于实地调研,全面分析宁波纺织服装企业技术创新
当今时代的发展,对于具有信息化素养的人才要求越来越多。随着"互联网+"概念的提出,社会对于培养具有信息化能力的学生的要求也越来越紧迫。如何在职教体系中培养学生的信息