基于桶密度的数据流聚类算法研究与应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:haifeng_liu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术、传感器网络与通信技术的高速发展,使得短时间内产生和传输大量数据成为现实,这种大量、快速、无限的数据被称为数据流(Data Stream)。目前,数据流处理技术广泛的应用在金融分析、传感器网络、复杂危险环境监控、网络监控和入侵检测等领域中。面对携带大量数据而又快速、连续到来的数据流,原本针对存储在磁盘货内存中的静态数据的传统数据库查询处理技术力不从心。因而,数据流处理技术对数据挖掘方法提出了更高的要求。作为数据挖掘的一个研究方向,数据流聚类分析技术已经成为热点研究课题。传统的面对静态数据的聚类分析方法主要有基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法、基于模型的方法。现阶段的数据流聚类方法很多都是在传统聚类方法上进化来的,比较经典的聚类算法Stream、CluStream、D-Stream算法的,都是在传统聚类的方法所做的改进。本文通过研究基于网格和基于密度的经典算法DBCAN、CliQue、基于数据流的经典算法CluStream,提出了一种基于桶密度的数据流聚类算法BDCluStream算法。该算法拥有CluStream算法和基于网格和基于密度的算法的优点。能够识别任意形状簇、在线层速度快、利用反馈原理解决部分桶边缘点丢失、不需要用户指定聚类个数等。利用改进算法BDCluStream构建了入侵检测系统,对系统各模块进行了详细的描述并给出了伪代码,最后使用Visual Studio2005设计并实现了基于对话框的入侵检测系统,目的在于检验算法在实际应用中的性能。利用KDDCUP1999数据集进行了实验,实验结果表明,本文提出的数据流聚类算法具有较好的监测能力,聚类速度快,能够适应高速网络环境下对海量数据聚类的要求。
其他文献
医学图像三维可视化技术是当前可视化研究的重点,也是实践中最常遇到的。直接体绘制技术是可视化中一类重要的技术。与从数据场中抽取几何面进行可视化的方法相比,体绘制方法不
随着互联网应用的普及,网络蠕虫对计算机系统安全和网络安全的威胁日益增加,给社会经济带来了巨大损失,网络蠕虫已经成为当今网络安全领域研究的重要课题。网络蠕虫传播模型是分
随着全国社会用电量跨跃式增长,电力工业进入快速发展时期,抄表系统也由原来的人工抄表系统,向着自动抄表、远程抄表、集中抄表方向发展。而在抄表系统中,嵌入式系统的引入及其应
随着互联网的日益开放以及网络技术的飞速发展,伴随而来的网络攻击行为也愈来愈严重,网络安全问题已经成为一个非常热门的话题,正逐渐受到人们的重视。传统的各种静态安全防御体
当前嵌入式系统的开发多为在嵌入式操作系统基础上的开发,这样可使开发人员专注于应用功能的开发,加快开发速度,降低开发风险。现有的商业嵌入式操作系统可提供通常的技术服务,但
随着人们对计算机网络的依赖性不断增强,网络安全越来越受到重视。网络中的入侵行为主要是指入侵者对计算机系统资源的非授权访问,可以造成系统数据的丢失和破坏、系统拒绝服务
高校成人高等教育发展迅速,成人高等教育的管理与普通高等教育的管理有一定差别,管理相应灵活复杂。尤其医学院校的成人教育基础课在校本部授课,临床实践课在远程附属医院授课,使
群体运动是自然界尤其是海洋生态系统中最常见的景象之一。无论是在陆地上还是海洋中,群体运动都有一个共同的特点:生物个体的行为相对简单,但当它们集群后,就会表现出复杂的群体
随着计算机的广泛使用和网络技术的迅速普及,出现了大量的信息,在这些信息中既有一股的可公开信息,也有需要保密的重要信息。数据库系统必须保证保密信息的安全存储和访问,如何保
随着科技信息技术的发展,电子政务系统在我国得到了快速的发展。我们利用信息技术生产和搜集数据的能力得到了大幅度的提高,各级政府部门、机构开发出了成千上万数据库,数据呈指