流数据查询系统结构及模式查询算法的研究

来源 :东华大学 | 被引量 : 5次 | 上传用户:lvlianpeng2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前许多应用需要支持对快速改变的流数据的在线分析查询处理。传统的数据库管理系统和数据查询算法不能很好地支持对流数据的查询已经被广泛认识,因而需要设计新的流数据查询管理系统和研究新的流数据模式查询算法。 认识到基于Web服务的方法可能成为电子商务和信息技术的基础设施,本文首先提出了构造基于Web服务的分布式流数据查询系统。该系统以建立在标准的Web服务技术之上的WSRF规范为基础。其次,本文的另一项工作是流数据中的模式查询算法的研究。对查询算法的研究,主要集中于流数据的相似性查询和流数据聚类算法研究。 本文的主要研究工作包括以下五个方面内容: 第一,提出了基于Web服务资源框架的流数据查询处理结构。许多当前出现的应用需要支持在线快速改变的流数据的分析处理,同时基于服务的方法在当前电子商务和电子科学领域开发分布式应用时受到广泛关注。因此,本文提出了解决分布式流数据查询的普遍框架,该框架构架于Web服务技术之上,遵守Web服务资源框架。这种分布式基于服务的结构增加了查询系统的可移植性,方便了整个系统的维护,使安装和管理更便捷。同时,这种系统结构把客户端(终端)从系统中分离出来,允许用户从不同的查询节点移动,共享和访问流数据查询处理系统提供的服务。 第二,提出了基于傅立叶变换(DFT)聚类方法的流数据相似性搜索算法。本文提出了先用DFT从时域到频域转换流序列,并用能量最大保持原理提取代表平均意义下能量最大的特征值,并使用聚类方法减少最终要保留下来的代表性子序列个数。最后提出了能够发现两个序列之间存在经过时间轴偏移、幅度放大或缩小以及上升或下降趋势等相似性关系的相似性查询算法。该算法能够处理基于滑动窗口和无限界标窗口模式下的流序列相似性查询问题。实验结果验证了提出算法的有效性。 第三,提出了一种基于摘要技术的在线快速混合模型流数据聚类算法。该算法为分阶段混合模型聚类过程。算法首先对最初到达的流数据用多维网格结构进行划分,对划分形成的每一个单元进行数据摘要,对该摘要运行基于模型的贪心聚类算法,聚类形成的混合模型的摘要信息存储在永久摘要数据库中,从而形成初始聚类
其他文献
目的探究高龄不稳定型股骨粗隆间骨折应用罗哌卡因复合舒芬太尼腰硬联合麻醉的效果及血流动力学变化。方法选取2017年7月至2018年7月本院骨科诊治的不稳定型股骨粗隆间骨折高
一我到过一个神奇的地方,差点儿陷在那儿回不来--要不是有个"心心相通"的孪生哥哥,今天我就不能坐在这儿给你讲故事啦!那天,我们小哥俩在老爸的试验室里,见到一个又大又笨的
期刊
南方优质米加工易碎,成本高,不利企业竞争。针对优质米生产加工中易产生碎米的原因,可从稻谷的品种、栽培、收购、储存、加工工艺和设备优化等方面入手,采取有效措施降低碎米率。
目的:报告针刀治疗颈性心脏病的临床疗效。方法:①针刀闭合术。②手法。结果:治愈98例,显效40例。结论:针刀结合手法治疗颈性心脏病临床疗好。
研究背景:恶性肿瘤是当前我国居民的第二大死因,大规模流行病学研究和肿瘤临床治疗都积累了大量数据,但由于缺乏有效的数据共享途径,肿瘤研究成果和临床治疗信息难以普及推广,极大
目的 探讨脑血栓应用阿托伐他汀与抗血小板药联合治疗的临床意义。方法 以脑血栓患者68例作为研究对象,按照完全随机原则分为对照组和观察组,各34例。所有患者均予以基础治疗
图像处理的最终目标是能够有效地传递视觉信息,达到延伸人类视觉器官的功能。因此处理的结果图像不仅要能反映图像的客观性质,还要考虑人的视觉特性,而图像本身的客观性质和人的