论文部分内容阅读
粗糙集理论是一种不需要先验知识且能有效处理不精确信息的重要工具,属性约简为粗糙集理论的核心应用,属性约简是针对一些高维海量数据计算复杂性和准确性问题而产生的一种数据预处理方法,其能够在保持条件属性与决策属性之间的依赖关系不发生变化的前提下,去除冗余与无用属性,降低信息数据复杂度,获得简明的特征子集与决策规则,从而提高数据挖掘质量与效率和机器学习性能。面对日益增长的海量高维数据,属性约简逐渐成为智能信息处理领域中的研究热点,并被广泛应用于机器学习、智能决策、模式识别、数据挖掘等诸多领域。
由于约简后属性数量的多少将直接影响到提取的决策规则繁简和性能,因此人们往往希望找到具有最少条件属性的相对约简,即最小属性约简,其为一个NP-难问题,专家学者一直在寻找更为有效的最小属性约简方法,随着智能优化算法的兴起,人们发现:相较于传统的属性约简方法,智能优化算法在解决属性约简等NP-难问题上更具有优势。针对最小属性约简问题,本文提出一种基于莱维飞行量子PSO算法(简记为LFQPSO)的属性约简方法,通过标准测试函数实验验证了LFQPSO算法的性能,UCI数据集约简实验显示:与其他约简方法相比,基于LFQPSO算法的属性约简方法在大多数数据集中能够求得平均长度最小的属性约简,约简性能良好。具体而言,本文主要工作在于:
第一,提出一种基于莱维飞行的量子PSO算法。设计了一种更为完善的早熟判断与应对机制,如发生早熟,立即引入莱维飞行机制,并在算法设计时引入个体最劣位置,使得早熟粒子飞向原本小概率搜索空间,寻优区域更为均匀,从而提高全局寻优性能。
第二,将提出的LFQPSO算法运用至属性约简问题求解中。兼顾属性个数和属性依赖度两方面构造最小属性约简数学模型,这两者在一定程度上是矛盾的,因此该问题属于多目标优化问题,通过设置权重系数将多目标优化问题转化为单目标优化问题,从而在保持决策系统一致性的同时得到条件属性较少的约简。基于LFQPSO算法的属性约简方法为最小属性约简问题的求解提供了一种新的更为有效的方法。
第三,将基于LFQPSO算法的属性约简方法运用至机场全自助值机模式优化中,删除冗余与无用属性继而挖掘出有利于机场进行决策的有用规则。
由于约简后属性数量的多少将直接影响到提取的决策规则繁简和性能,因此人们往往希望找到具有最少条件属性的相对约简,即最小属性约简,其为一个NP-难问题,专家学者一直在寻找更为有效的最小属性约简方法,随着智能优化算法的兴起,人们发现:相较于传统的属性约简方法,智能优化算法在解决属性约简等NP-难问题上更具有优势。针对最小属性约简问题,本文提出一种基于莱维飞行量子PSO算法(简记为LFQPSO)的属性约简方法,通过标准测试函数实验验证了LFQPSO算法的性能,UCI数据集约简实验显示:与其他约简方法相比,基于LFQPSO算法的属性约简方法在大多数数据集中能够求得平均长度最小的属性约简,约简性能良好。具体而言,本文主要工作在于:
第一,提出一种基于莱维飞行的量子PSO算法。设计了一种更为完善的早熟判断与应对机制,如发生早熟,立即引入莱维飞行机制,并在算法设计时引入个体最劣位置,使得早熟粒子飞向原本小概率搜索空间,寻优区域更为均匀,从而提高全局寻优性能。
第二,将提出的LFQPSO算法运用至属性约简问题求解中。兼顾属性个数和属性依赖度两方面构造最小属性约简数学模型,这两者在一定程度上是矛盾的,因此该问题属于多目标优化问题,通过设置权重系数将多目标优化问题转化为单目标优化问题,从而在保持决策系统一致性的同时得到条件属性较少的约简。基于LFQPSO算法的属性约简方法为最小属性约简问题的求解提供了一种新的更为有效的方法。
第三,将基于LFQPSO算法的属性约简方法运用至机场全自助值机模式优化中,删除冗余与无用属性继而挖掘出有利于机场进行决策的有用规则。