时间序列数据中的模式挖掘及其在地震预报中的应用研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:cdwkevin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文旨在研究针对时间序列数据的模式数据挖掘的理论、方法和实际应用,并针对地震数据的特点研究适合于地震时间序列数据的挖掘算法,寻找隐藏在大量地震前兆观测流数据背后的规律,发现潜在的、有价值的地震预报知识。具体内容包括时间序列数据挖掘中的数据预处理方法、相似性匹配、序列划分方式以及时序模式挖掘算法等四个方面。 在预处理方面,综合多种预处理方法,用统计数据模型增强预测的能力,用数字信号处理方法提取数据的主要特征,并构建地震前兆数据仓库,以实现一个完整的数据挖掘平台。 在时序相似性匹配方面,研究能处理一个或者多个变量的多维时序的相似度度量问题,用基于动态时间变换的模糊比较方法和基于奇异值分解的多变量序列比较方法,达到高效的不精确匹配和具有较好的通用性和灵活性的目的。 在探讨动态时间序列划分方法方面,考虑到挖掘多种长度和层次的时序模式的需要,结合多种划分策略和基本模式,使得对实时流数据的划分达到最优化。 针对历史数据和实时流数据的不同特点,对相应的时序模式挖掘算法进行研究。本文对静态历史数据使用相似相邻向上合并的方法挖掘具有不同长度频繁模式;对实时流数据,在动态实时划分的基础上,使用基于滑动窗口的实时时序模式挖掘算法,采用内存和外存两级式的时序模式存储结构,在时间窗口的基础上寻找最近频繁模式,以提高更新和检索的速度。将隐马尔可夫链的方法用于通过外在特征来分析事物的内在状态转换。 最后,为提高运算速度和处理大数据量的需要对数据挖掘算法进行并行化工作。由于地震前兆数据数据量大而且包含多个变量,本文提出了适用于海量历史数据的并行划分数据策略和算法,该算法能够快速、高效地在集群式高性能计算机上进行处理,这样不仅提高了速度,而且有效地减少了挖掘长序列的巨大时空开销,此外还有对实时流数据模式挖掘的动能划分并行。
其他文献
众所周知,神经网络在优化计算,联想记记,信息处理,图像处理,模式识别等方面有着广泛应用前景,因此对其动力学性质的研究具有重要意义。自1982年Hopfield模型提出以后,该模型动态行为
随着电子商务中业务和用户规模的不断发展,传统采购管理系统在资源组织和调度等方面的不足逐渐体现出来,基于云计算的采购管理系统恰好能够解决上述问题。本文以云环境下采购
汉语自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对歧义字段的处理是影响分词精度的关键,国内外许多研究人员在这一领域都进行了深入的研究,
随着现代网络规模和复杂性的不断增加,网络故障管理及维护变得越来越困难。为了有效地将海量的原始网管信息应用于网络故障诊断和预测,迫切需要引入基于知识发现的智能信息处
针对钻井企业物料管理中因钻井物料库存量大、种类多、价值高而导致的管理难度大、成本高的现状,指出钻井企业实施ERP系统的必要性。采用ERP物料清单的管理思想和方法,在钻井工
随着Internet技术和信息技术的迅猛发展,使得网络环境中充斥着各种不同来源,不同格式,不同形态的多元异构数据信息,如何完成对这些异构数据信息的统一访问,这就要求实现多元
随着网络规模的日趋庞大,结构的日益复杂和多变,传统的解决单个网络安全问题的方法已经无法满足需求。对网络的整体运行情况进行感知和预测,已经逐渐成为当前网络安全领域的
分布式GIS是当前地理信息系统领域研究的热点和前沿。本文介绍了分布式组件对象模型技术(DCOM)和分布式GIS的概念及特点,分析了电力通信资源管理发展的趋势,着重探讨了如何构
随着中国石油勘探与生产信息门户应用范围的不断扩大,用户对应用系统的高效性、灵活性、个性化提出了更高的要求。信息门户现有的功能不能完全适应勘探与生产公司的业务需求,成
面向飞行器的协同设计研究是一项新的设计技术,该研究工作受到了“十五”863计划的支持,其主要目的是能够在更短的时间里,完成高质量、低成本、满足市场需求的设计产品。因为