基于遗传算法的朴素贝叶斯分类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:yuxuan423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘领域中重要的研究分支,国内外己经取得了许多令人瞩目的成就。朴素贝叶斯分类器由于计算高效、精确度高,并具有坚实的理论基础而得到广泛的应用。然而,朴素贝叶斯分类器的条件独立性假设限制了对实际数据的应用。遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法,具有简单、通用、稳健等特性,使其在复杂实际问题的求解中显示出巨大的优越性,而且能在概率意义下收敛到问题的全局最优解。 本文基于遗传算法,对朴素贝叶斯分类问题进行研究,主要工作如下: (1) 概述数据挖掘的研究背景,数据挖掘的主要任务,描述了数据挖掘中分类问题的定义、方法以及分类模型评价的标准等。 (2) 描述了朴素贝叶斯分类模型,朴素贝叶斯分类模型的一般原理,以及存在的问题。 (3) 阐述了遗传算法的基本思想,并描述了遗传算法的一种改进算法即自适应遗传算法。 (4) 将遗传算法引入到朴素贝叶斯分类研究中,提出一种基于遗传算法的朴素贝叶斯分类算法(G_NBC),该算法为避免数据预处理时,训练集的噪音及数据规模过大使属性约简的效果不太理想,并进而影响分类效果的问题,在训练集上通过随机属性选取生成若干属性子集,并以这些子集构建相应的朴素贝叶斯分类器,进而采用遗传算法进行优选。实验表明了该算法的有效性。
其他文献
计算网格被用来解决广域网中分布的资源共享、互联和互操作问题。随着数据密集型应用的飞速发展,数据呈爆炸式增长,数据网格技术应运而生,而且正成为网格技术的另外一个研究
软件复用与构件库技术一直是计算机软件工程领域的研究热点。构件表示与检索技术,是构件库技术的核心技术,也是软件复用的重点研究领域,国内外提出过很多的表示方法与检索形
图形用户界面(Graphical User Interface,GUI)软件测试烦琐,自动化测试势在必行。当前GUI软件自动测试工具存在回归测试复杂、覆盖率低、测试脚本复杂等问题,测试质量没有保
基于trace(跟踪信息)的分析一直被用来引导和促进软硬件的设计。对象存储文件系统作为下一代互联网信息存储的核心技术,结合了块存储和文件存储的优势,在数据共享、安全性及
一部具有尽可能多相关联的语法信息、语义信息、语用信息的语义词典(Semantic Dictionary),是自然语言理解、学习的基础和关键。 语义研究,特别是词汇语义研究,成为目前自然
视频编解码标准从最早的MPEG-1和H.261开始发展,到如今使用广泛的H.164/AVC,再到下一代编码视频标准HEVC(H.265),经历了多核发展过程,针对的分辨率也越来越大。从 QVGA到现在的8Kx4
随着计算机技术的广泛应用,对计算机安全的要求也越来越高。由于攻击手段的多样化和攻击技术的发展,传统的被动防御措施已不足以保证主机系统的安全。作为一种新的防御手段,
XML(eXtensible Markup Language)已经成为一种Web数据交换和信息集成的工具。随着XML应用的普及,解决好XML文档的存储、管理和查询等问题特别是查询问题,构造一个能在应用中
智能规划(AutomatedPlanning)是人工智能(ArtificialIntelligence)研究领域的一个重要分支,在各个领域得到广泛的应用。其主要思想是:对周围环境进行认识与分析,根据预定实现的
由于在分布式协作环境中进行设计工作时,要求不同的系统设计工具之间能够互相衔接与利用,使得完成设计任务的流程能够平滑的相连。因此,如何高效地集成系统设计工具成为首要