基于比特序列变化模式聚类的时间序列相似搜索

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qq13545197270
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是一种重要的数据类型,在商业、医学、工程和科学等应用领域具有广泛应用。从生活实际中积累的时间序列数据库,记录了大量的重要信息。当前迫切需要提出有效的方法对时间序列进行处理,挖掘数据间隐含相互关系,并找出相似的序列。由于其重要性,时间序列相似性搜索问题正得到越来越多的研究。时间序列相似性问题的一个重要部分是搜索具有相似变化模式的序列,而目前时间序列相似搜索算法存在一些不足。提出了一种基于比特变化模式的时间序列相似搜索方法,该方法将时间序列的变化模式建模成一定长度的比特序列串,用比特序列串间的比特距离来反应变化模式的相似程度。为了避免对时间序列数据库顺序扫描,该方法对具有相似变化模式的时间序列进行聚类,在聚类得到的簇集上建立B+树索引。搜索过程则分为两步,首先在聚类索引上进行,找出具有相似变化模式的序列的候选集合,然后通过精确搜索剔除候选集中不符合要求的序列形成最终的结果,从而保证了相似搜索的效率。在实验设计上,模拟数据集由计算机随机产生,维度分别为20d、30d、45d和60d,时间序列记录数从10,000到600,000,实验中的各种相似搜索方法均采用相同的数据集。实验结果表明,该算法能够有效进行相似序列搜索,并能达到良好的搜索效率。
其他文献
网格技术试图将广域分布的各种计算资源、存储资源、仪器设备等集合起来进行有效聚合和共享,并以统一的方式向外界用户提供服务。网格系统的设计是一个非常复杂的系统工程,它
为了满足在未来航天器上进行科学实验和空间探测的有效载荷数据采集、处理、存储、综合传输和数据管理需求,我国开始进行星上数据管理系统研究,本论文重点研究了基于1553B数据
随着Internet的广泛应用,导致庞大的数据库日益增多,为了从这些数据中提取出对数据库拥有者有价值的信息,数据挖掘这门学科应运而生。目前数据挖掘技术之所以被认为具有令人兴奋
随着计算机网络的迅速发展,互联网用户不断激增,网络的拥塞也变得越来越严重。自从Jacobson于1988年提出拥塞控制的概念以来,拥塞控制引起了人们极大的关注,各种拥塞控制理论以及
随着工业自动化的发展,基于GPRS的城市内集中监控系统得到广泛的应用。GPRS模块通讯的设计和开发成为主要的问题。本文分析了当前GPRS通讯模块开发中存在的若干问题,并针对这些
本论文介绍了一个基于形式语言的加密系统,并针对此系统实现的难点——密钥的存储与管理,提出一种码字表的存储方法。在对加密系统和前人研究的结果进行分析的基础上,总结原实现
随着信息化、数字化的发展,传统的广播电视节目已经实现用户点播的功能。目前整个广电行业的焦点聚集在了“数字电视”业务上。如何有效地管理数字电视用户信息,推动数字电视
本文介绍了作者参与设计和实现的远程教学平台中的考试与评价子系统,该系统以基于建构主义理论的现代教学模式与教学评价方法为指导,以因特网为传输载体,采用基于B/S模式的架
将电子商务引入保险行业,是信息技术不断发展的结果。PICC电子商务平台是中国人民财产保险股份有限公司在市场经济的大环境下,本着以客户为中心的宗旨,为更好的拓展保险业务
目前,文本自动分类是信息检索领域中的研究热点之一,传统的文本分类方法是采用词作为特征构建特征向量,但是文本中词的数量非常大,导致了特征向量空间的维数非常高,因此需要