降维分类方法在入侵检测中的研究与应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:zhengwei2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的目的在于解决高维度数据的实时分类问题。大数据环境下,都会出现有运算效率,大数据量和实时性要求的分类问题,例如,如何从髙维度的网络数据中实时检测出入侵行为;如何从公司大规模的交易业务数据中检测出异常交易行为;如何从电商销售数据中通过对用户的历史行为对用户进行分类等。常用的分类方法有KNN,SVM,贝叶斯分类,决策树等,该类方法分类的准确率及实时性仍有欠缺,尤其是在髙维情况下难以有效处理。本文提出一种基于正交投影的降维分类方法,能够高效地训练分类模型和快速分类。  该方法先对数据集进行预处理,剔除噪声数据和缺失值;选择参与分类的属性,构建多分类坐标平面集,通过将各坐标平面进行栅格化,使用二维矩阵进行表示。然后对各属性进行线性映射,将多维数据集投影至栅格中进行统计,用多组二维矩阵记录各类型数据栅格化后的投影频数。训练集数据投影完成后,对各矩阵表示数值型数据的方向进行高斯模糊处理,得到一系列密度矩阵。将待分类数据向密度矩阵进行投影,获得投影点位置的数值,通过比对投影后的矩阵信息,获得其分类信息。若保留模糊前的矩阵,通过将增量的数据集叠加投影到矩阵上,再进行高斯模糊,则能实现增量机制。  传统分类方法试图在空间或更高阶的空间中寻找分类面,而本文方法则从数据在各投影面上的分布密度出发,通过综合考虑各概率密度进行分类判断。该方式较完整地保留了数据的边缘密度,因此能较好地还原数据点的空间分布信息。因此能在较小运算量下得到较高的鲁棒性,尤其适用于处理数据量大,维度较高的分类问题。  本文运用KDD CUP99网络入侵检测数据进行实验,尝试对19种入侵类型以及一种正常类型进行分类。KDD cup99包含4898429条记录与31维属性,本文挑选其中18个属性进行实验,从所有记录中随机抽取10%作为训练集,其余90%作为测试集。使用150*150的单精度浮点矩阵对每个坐标平面进行栅格化表示,共有20*C218个矩阵。实验结果显示训练模型耗时6193毫秒,分类耗时14133毫秒,总体准确率达到了98.42%,其中5个样本充足的入侵类型识别结果良好,说明了应用本文方法构建入侵检测系统的可行性与高效性。
其他文献
随着Web应用和云计算技术的发展,越来越多的人开始选择在云计算环境中开发和托管自己的应用。近几年来,云环境中的Web应用发展迅速,应用本身的规模和功能模块都变得愈加复杂,同时
当今,随着计算机技术的发展,计算机网络已经成为我们生活中必不可少的一部分。然而,由于网络扮演的角色越来越重要,网络安全问题也成为重要的研究课题。在众多的网络攻击和入
学位
由于物联网应用往往伴随着复杂多变的物理环境,各种外部干扰和内部节点的原因都有可能导致物联网感知层终端采集的数据不可靠,因此,高效的物联网需要具备有自组织、容错性与动态
传感器网络作为一项新兴的信息采集技术,随着无线通信技术的迅猛发展,日益得到重视。无线传感器在很多领域和应用中都得到了有力的推动和普及。解决无线传感器网络中能量的问题
随着在计算机技术与机器人技术方面的不断发展,智能机器人的研究受到越来越多研究者们的关注。而机器人定位是机器人实现自主化和智能化的关键技术之一。定位技术在很大程度上
新一代航空电子系统实现数字化,综合化,和智能化的核心与关键之一是机载图形显示系统。机载3D图形引擎的性能决定着机载3D图形显示系统的图形显示质量,稳定性和图形渲染效率,所
学位
随着网络和信息技术的飞速发展,基于网络平台的各类应用系统被广泛地应用到人们生产和生活的各个领域。在登录各系统时存在着重复性的身份认证工作,这在降低了系统使用效率的同
在传统安全领域,恶意代码查杀主要依靠特征码匹配以及无特征码技术,前者快速准确但存在特征码滞后和膨胀问题,后者则存在较高的误报率和虚警率。凭借云自身强大的计算和处理能力