基于无监督异常检测的并行聚类算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:kfanffvga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术和通信技术的迅猛发展,网络安全问题也变得日益突出。入侵检测技术作为一种主动的安全防护技术,有效地弥补了防火墙、数据加密等传统安全防护技术的缺陷,已经成为网络安全的一个重要研究领域。  由于数据挖掘技术能够从海量无规则数据集中挖掘出人们感兴趣的特定模式,减少数据处理量,所以专家们将数据挖掘技术引入到入侵检测的研究与开发中。聚类分析方法是数据挖掘中一种典型的无监督异常检测技术,可以在无标记的数据集上发现异常数据,提高入侵检测的效率,减少人工参与量,因此该方法逐渐发展成为一种重要的入侵检测技术。但是,当处理维度高、结构复杂、数据量庞大的数据集时,传统聚类算法的聚类效率非常低。为了提高聚类效率,并行聚类算法成为人们研究的热点。  本文将并行思想与传统聚类算法相结合,提出了一种基于k-means算法的并行聚类算法。该方法首先利用MPICH构建计算机集群系统,然后通过并行编程使集群中各节点主机并行处理数据集,达到高效聚类大规模数据集的目的。为了优化聚类结果,本文又提出了基于平方误差最小的重定位算法,并给出重定位的终止条件,从而提高了重定位效率。通过基于KDDCUP99数据集的实验测试,结果表明,本文算法不但比传统算法具有更高的聚类效率,而且能够更加有效地检测出已知和未知攻击。最后开发设计了一款基于本文算法的入侵检测仿真系统,该系统通过国家版权局认证,获得计算机软件著作权登记证书。
其他文献
近些年来,随着农业的进步,农药的应用越来越广泛,农药的使用在给农业带来经济效益的同时,也严重影响了农业生态环境。农药污染破坏生态环境,影响生物的生存和人类的健康,这些
在移动通信领域,随着3G互联网高速数据接入,传统的语音业务和短信业务逐渐饱和,各种移动增值业务快速的发展。互动化、娱乐化和生活化的增值业务逐步发展成为移动运营商主要的赢
肌肉发育和抗病性状相关基因的筛选和鉴定,对于鸡的品种改良和育种具有重要的理论参考和利用价值。NF-κB是调控免疫应答和肌肉分化过程的重要转录因子,AKIRIN2通过间接作用N
本文主要研究了压缩感知的理论和压缩感知在脉冲超宽带雷达中的应用,压缩感知(CS)理论是由Donoho,Candes,Tao和Romberg等人于2004年提出的,它为传统的信号采样理论带来了变革。对信