【摘 要】
:
随着信息技术的快速发展,在人们的日常生活中出现了各种信息系统,产生了海量的时间序列数据。如何有效地利用这些历史时序数据,从中挖掘出用户需要的信息已经成为当今数据处
论文部分内容阅读
随着信息技术的快速发展,在人们的日常生活中出现了各种信息系统,产生了海量的时间序列数据。如何有效地利用这些历史时序数据,从中挖掘出用户需要的信息已经成为当今数据处理领域广泛关注的热点问题。首先分析了当前分布式计算的关键技术,然后对时序数据处理进行了相关研究,最后提出了一种基于Hadoop平台的时间序列数据增量计算方法及系统。主要工作内容如下:1.分析分布式系统关键技术,对Hadoop整体框架进行分析。文中首先对分布式系统中关键技术进行探讨,然后通过搭建Hadoop平台,结合MapReduce计算模型给出了实际数据处理的实验案例,最后对实验结果进行了详细的分析。2.对时间序列预测算法、时间序列相似性度量算法进行了分析和改进。文中通过对真实数据的理解及建模,实现了时序数据的预测过程。最后,在分析时间序列相似性度量算法的基础之上,提出了支持增量数据的时间序列相似性度量算法—Inc-DTW,并通过实验及理论对所提出的方法进行验证。3.在进行数据处理时,数据是随时间的推进在不断的增加,如何才能进行高效的增量计算是目前数据处理领域的一个研究热点。本文中结合Hadoop平台以及时间序列数据相关特点提出了一种Hadoop平台时序数据增量计算方法及系统-TSI-Hadoop。TSI-Hadoop具有以下特点:(1)提供了常用时序数据处理算法的支持;(2)提出基于MapReduce计算模型的分段时序数据增量计算模型;(3)针对时序数据特点,提出带有状态的滑动窗口增量计算方法。最后对我们提出的方法及系统进行了相应的实验验证。
其他文献
目的探讨T2DM外周感觉神经病变和心自主神经病变之间的关系。方法选取T2DM患者148例,采集临床资料,测定FPG、HbA1c及LDL-C等生化指标;进行定量感觉神经检查(以色列TSA-II定量
我提一些关于合作社的看法,合作社为什么在农业领域风靡?主要是因为农业的特性——农业是一个家庭经营的,所以我们应该从组织和制度上来认识它。合作社按新制度经济学来讲是制度
目的:探讨精氨酸对外科重症患者营养和免疫的影响。方法收集32例外科重症患者,随机分为精氨酸组(n=16例)和对照组(n=16例),精氨酸组患者在常规营养支持基础上静脉给予精氨酸20g/d,连
高职日语专业的学生只有能够适应社会人才需求,充分发挥个人能力和展现职业素养,作为企业员工创造出财富,才能得到社会的认可。高职日语专业生存和发展需要不断改革和创新人
针对飞控模拟装置中基于HDLC协议通信需求,完成了一种新的基于FPGA+ARM架构HDLC协议控制器的设计。文中首先介绍了HDLC协议的帧结构和循环冗余校验(CRC)原理,然后结合FPGA可进行任
文章设计了一款易调谐的小型圆极化微带天线,采用在方形贴片表面对角开槽的方式减小天线尺寸,利用在地板上加载2对非对称的窄槽来激发圆极化辐射波,并在地板中心处加载1个方
在众多教师的观念中,科学知识是具有“客观性”、“价值中立性”、“普遍正确性”等特性的,由此造成教师创新意识淡薄,教师教育研究相对滞后,教师缺乏对知识及课程的反思、批
教师反思在中外教师教育、课堂教学等领域,受到广泛关注。但是,不同学者所应用的反思概念可能不同,实践者所质疑与欢迎的教师反思也可能迥异。文章通过梳理教师反思的不同思
目的探讨超声造影(CEUS)在肝恶性肿瘤病灶诊断及引导射频消融(RFA)治疗中的应用价值。方法对经病理确诊并经RFA治疗的56例肝癌患者资料进行回顾性分析,术前比较增强cT、普通彩色多
中学体育在历史、环境、社会等主客观因素的影响下,面临着一些困境:观念中长期以来对体育教育的淡化、漠视及误解;客观条件的制约;个体差异,这些因素对中学体育教育来说既是