论文部分内容阅读
遗传算法是一种非常通用的优化算法,其编码技术和遗传操作比较简单,对优化问题的限制性条件要求很低,具有很强的并行性和全局搜索能力。它能解决很多类实际问题,目前已经在机器学习、模式识别、图像处理、优化控制、组合优化和管理决策等领域得到了很好的应用。因此对遗传算法进行全面的、深入的研究具有重要的意义。
在本论文里,主要针对遗传算法在数据挖掘领域中的应用进行研究,所做的工作的主要有:
(1)总结近年来数据挖掘和遗传算法的研究与应用现状。对数据挖掘进行了概述,简单介绍了什么是数据挖掘,为什么要数据挖掘,如何进行数据挖掘以及数据挖掘的主要过程,阐明了数据挖掘和遗传算法的产生与发展以及他们的相互结合。
(2)介绍了数据挖掘中的一个重要算法——遗传算法,对遗传算法主要理论进行了简要的介绍,讨论了遗传算法的编码方法、遗传算子的设计和适应度函数的构造,并把算法运用在数据挖掘技术中。提出改进的遗传算法及对其代码的基本实现。介绍了遗传算法在数据挖掘中的一些应用,提出了基于遗传算法的关联规则的提取方法,讨论了关联规则的Apriori算法。
(3)给出了用遗传算法进行关联规则挖掘的实例,并讨论了遗传算法所面临的问题与挑战。遗传算法,作为一种新生事物,刚一面世,就展现了强大的生命力和广阔的发展空间。尽管遗传算法仍然存在一些不足和缺陷,但随着算法的不断改进、应用领域的不断拓宽和基础理论研究的不断完善,它在科学研究和实际应用中所起的作用将会越来越大。
对算法应用的数据测试和性能分析表明,改进算法具有计算效率高、稳定性好等优点,可以用来获得全局最优解。