论文部分内容阅读
在社会生产和生活中存在诸多优化问题,优化问题往往具有复杂、高维、不确定和非线性的特征,求解优化问题是当前研究的热点领域之一。元启发式算法通过模拟自然界中生命现象来求解优化问题,具有操作简单、并行性强、寻优效果好的特点。用元启发式算法优化机器学习分类模型的参数选择,能够提高模型的分类效果。此外用元启发式算法选择分类数据集的最优特征子集可以进一步提升分类模型的精度。本文尝试用元启发式算法来优化分类模型的参数和特征选择,并应用于漏洞分类问题中。本文的主要工作有以下三方面。乌鸦搜索算法是2016年提出的一种元启发式算法,具有结构简单、易于实现的优点。该算法通过模拟乌鸦觅食行为提出,在迭代初期存在种群单一,分布不均匀的问题,导致算法存在容易陷入局部最优和寻优精度低的问题。针对这些问题,本文提出了一种基于参数动态递变和高斯变异的改进乌鸦搜索算法。该算法在迭代过程中引入参数动态递变规则和高斯变异,利用迭代初期较大的参数值和变异空间,提高解的多样性,避免算法过早陷入局部最优。而在迭代后期,参数值和高斯变异空间变小,有利于加快收敛速度和增加解的精度。改进后的乌鸦搜索算法用于优化KNN分类模型的参数和特征选择。利用改进乌鸦搜索算法优化KNN分类参数,能够获得比随机选择更优的KNN参数。通过改进乌鸦搜索算法选择分类特征子集,降低数据的维度和计算复杂性。两者结合,能够提高KNN分类模型的精度。改进乌鸦搜索算法优化参数和特征选择的KNN用于解决漏洞分类问题。在漏洞数据集CNNVD和NVD上进行测试,证明优化后的KNN能更有效的精简漏洞数据集的特征,提高漏洞分类的准确率和效率。