论文部分内容阅读
本文对利用遗传算法解决数值优化问题、执行数据挖掘任务的现有理论和应用成果进行了分析总结,在此基础上,探究了对遗传算法在这一问题域的宏观及微观策略进行改进的方法和技术,提出了若干改进措施和一种新的并行遗传算法框架,最后将遗传算法与支持向量机技术相结合,探讨了遗传算法应用于数据挖掘的一种新的手段和方法。全文主要内容如下:
1.对数值优化及数据挖掘作了简要的介绍,并对遗传算法在这些问题域的应用现状进行了回顾和总结。
2.对遗传算法中有关编码问题的讨论,尤其是针对数值优化的现有编码策略进行了总结,之后,分析了遗传算法与二进制空间的关系,并在Holland的模式理论与Vose的推广模式理论的基础上,针对数值优化问题域的特点,提出了一种经修改的模式定义,以此为依据,设计了二进制编码遗传算法的两个新算子,并进行了实证研究。
3.借鉴计算机内部对浮点数的表示方法,提出了一种新的编码策略——浮点二进制编码及相应的遗传算子,对该编码在问题空间中非均匀采样的性质进行了分析,同时,以该编码为基础,设计了一种新的层次型遗传算法,并通过数值实验对其求解若干多峰函数的表现与已有算法策略进行了对比分析,证实了其较好的全局搜索性能。
4.总结了实数编码交叉算子的若干设计原则及分类方法,以此为指导,针对几种常用的交叉算子,设计了一组实验,借助于种群分布数字特征及分布图,研究了不同算子对种群分布的作用规律,并据此提出了针对不同问题特征选择不同交叉算子的策略。
5.对实数编码非均匀变异算子作用下的种群分布演化规律进行了理论推导,在此基础上,提出了针对该算子的适应性调整策略,并通过数值实验进行了验证。
6.总结了遗传算法在数据挖掘中的应用现状,介绍了作为一种数据挖掘新方法的支持向量机技术,并对其中存在的优化问题进行了分析,提出了利用遗传算法求解支持向量分类机及支持向量回归机的思想和方法,最后,通过对比实验就所提出算法的性能进行了验证分析。