数据流滑动窗口频繁模式挖掘算法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:rj1340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的快速发展与网络的广泛普及化,数据形式变得更加多样化,传统的静态挖掘技术无法适应快速流动的动态数据的挖掘,数据挖掘的研究向着更深入的方向发展。其中,数据流是新出现的重要的数据形式。同时,数据挖掘技术研究成果已被广泛应用到关联规则挖掘、关联分类和序列模式挖掘等具体应用中。频繁模式挖掘就是其中一个重要的研究方向。因此,数据流中频繁模式的挖掘成为数据挖掘领域的一个研究热点。本文提出了基于数据流滑动窗口的频繁闭项集挖掘算法LevelMoment.目前利用位图结构存储数据的算法NewMoment,是比较高效的频繁闭项集挖掘算法。LevelMoment算法改进了NewMoment算法,提出新的数据结构LevelCET,同时提出层次检测策略与最佳频繁闭项集检测策略,在LevelCET上采用层次检测策略与最佳频繁闭项集两种检测策略快速挖掘频繁闭项集。通过实验证明,LevelMoment算法时间效率优于NewMomnet算法。在频繁模式挖掘中,最大频繁项集具有数据量少且表现形式简单的特点,成为近年来的研究热点。本文提出了基于数据流滑动窗口的最大频繁项集挖掘算法MNFPT,该算法采用字典序列树NFP-tree存储数据,并且根据新旧事务的特点,采用集合检测的策略对数据集进行维护,并将挖掘的最大频繁项集存储在树结构中,更加方便于用户的查询。最后通过实验验证了算法的有效性。
其他文献
扩展频谱通信(简称扩频通信)是应用频谱展宽技术,实现加密、选址通信的一种通信技术。扩频技术就是把要发送的信号扩展到一个很宽的频带上,然后再发送出去,系统的射频带宽比
色谱-质谱联用仪集色谱分离和质谱分析优势为一体,被广泛应用于环境化学、公共安全、医药卫生、蛋白质组学等领域。软件系统作为联用设备的重要组成部分,对数据的分析处理效果
随着互联网的普及与电子商务的迅猛发展,传统易货在电子商务中得到新的发展。电子易货就是将易货与电子商务相结合的现代易货交易形式。电子易货作为现金交易的补充可以解决
随着网络普及,安全以及需要确保在大规模的网络数据传输技术的进步越来越快是高效完成不可或缺的。许多公司和运营商都在网络上传输重要的信息,但没有数据泄漏是不能容忍的。本
就像许多其他技术一样,为了军事需要,无线传感网络应运而生。随着嵌入式系统的发展,无线传感网络相关的应用也越来越广泛,并以同样的方式应用到民用监测领域,例如目标跟踪,入
随着互联网的迅猛发展,人们需要更多的网线并要求其有更高的传输速度,而更高的速度将导致双绞线内部的串扰显著增加。因此,为了能在网线生产过程中将串扰维持在一定的范围内,便需
Internet的飞速发展,一方面使得用户对网络流媒体提出了更多的服务需求,另一方面也为互联网提供了大量的闲置资源。如何有效利用数量和能力不断增长的闲散资源为用户提供保证质
经济的快速发展带来了环境问题,其中大气污染是其中比较严峻的问题之一。通过大气污染预报模型对空气中的颗粒物浓度进行预报,一方面分析出污染物趋势以及各种因素对空气质量的
随着软件技术的快速发展和软件应用范围的不断扩大,软件系统规模越来越大,软件功能日趋复杂,软件的需求获取变得更加困难,这表明需求分析在整个软件开发过程中具有十分重要的
随着视频点播服务的流行,对VOD系统的大规模分发需求也越来越高。传统的CDN架构VOD系统的部署和维护费用相对较高,而且它的单一服务器的负载有限,系统的扩展性难以满足发展的