基于遗传算法的混合特征选择方法研究

被引量 : 0次 | 上传用户:xsxiaomo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别、统计学、机器学习和数据挖掘等许多学科,特征选择一直都是一个活跃的研究方向,且在文本分类、图像检索、客户关系管理、入侵检测和基因组分析等中都有非常广泛的应用。特征选择的主要思想是:通过消除具有很少或根本没有预测信息能力的特征,选择输入变量的子集。特征选择可以明显地提高所产生的分类模型的可理解性,并通常能有助于建立一个对未知数据具有较好泛化能力的模型。本文首先较全面地阐述了特征选择的理论基础和基本步骤,随后简介了一种随机化搜索方法——遗传算法。基于不同的评估准则,特征选择可被划分为过滤模式和封装模式。为了将遗传算法和标准化互信息的特征选择算法的优点充分地利用起来,本文提出了一种基于标准化互信息和遗传算法的两阶段特征选择方法。其中基于标准化互信息的特征排序算法是一种过滤式特征选择方法。该方法首先采用标准化互信息对特征进行排序,然后使用排序在前面的特征初始化第二阶段遗传算法的部分种群,使得遗传算法的初始种群中包含一些较优良的个体,从而遗传算法仅仅需要较少的时间就可以得到令人满意的结果。该算法包括一个初始化过程和自适应的交叉、变异操作。实验结果表明,可以获得一个约减的较小特征集合来实现相等的或更高的预测精度,并且运行该算法所花费的时间较少。通过移除冗余、不相关和噪音特征,特征选择可以改进预测准确性和分类器(预测模型)的可理解性。许多采取不同搜索策略的特征选择方法已经得到了应用。然而,却发现没有任何单个准则适合于所有的应用。为此,本文提出了一种基于遗传算法的混合选择框架,该框架能将多种现存的选择方法有机地联合起来。该算法的优点包括:1)可以容纳多个特征选择标准,从不同的标准评价特征;2)该方法可以找到较小的特征子集并且在特定学习算法的分类器上运行效果较好。在实验中,使用三个现存的特征选择方法,用遗传算法将这些基于不同准则的方法有机地结合起来,以达到较好的特征选择效果。实验结果表明,比起单个选择方法,该方法在分类精度和特征约减方面是有成效的。文末,汇总全文工作,并对未来研究工作进行了初步展望。
其他文献
满族发源于我国东北地区——白山黑水之间,在其漫长的历史发展过程中融合了蒙、汉、回等其他民族的文化而形成了独特的满族文化。孕育了多种多样的民间艺术形式,与美化生活、
血管周围间隙(Perivascular spaces, PVS)是在一个多世纪前由德国病理学家R.Virchow和法国生物学、组织学家C.P.Robin提出,后来命名为Virchow-Robin腔(Virchow-Robin space,
目的探讨手术室运用PDCA模式提高腹腔镜器械清洗合格率的效果。方法本科2016年8~12月(实施PDCA模式前)清洗腹腔镜器械200套,2017年1~7月(实施PDCA模式后)清洗腹腔镜器械200套。将两
目前社会对电力的需求越来越大,对供电质量和可靠性的要求也越来越高。变电站选址与定容作为配网规划中的基础性优化问题,不仅可以带来有效的经济效益,而且可以提高未来网络
采茶戏是地方小戏,产生于民间,流传于民间,至今已有数百年的历史。采茶戏具有浓郁的生活气息,不仅题材和内容贴近生活,很多动作也来源于生活,表演载歌载舞,真实而生动地反映
继佘祥林案、王海军案、杜培武案等后,又接连发生了赵作海案,面对这些有违社会正义、自由的冤假错案的频繁发生,无疑使人们对法律和司法机关大失信心。著名的英国哲学家培根
高等职业教育是伴随着我国经济建设和社会进步而逐渐发展起来的一种新型的高等教育类型,是我国高等教育的重要组成部分。从上世纪90年代开始,我国高等职业教育得到了较快的发展
课堂参与是指学生在课堂上的一种活动,例如,课堂讨论,提问问题,回答问题及课堂辩论等。新的大学英语课程要求中规定外语教学中教师要逐步退出中心领导地位,要注重以学生为中心,要重
进入21世纪以来,儿童阅读推广活动蓬勃发展,各种推荐书目涌现。推荐书目关乎儿童阅读推广的实质内容,但当前对儿童阅读推荐书目的理论研究多处于感性、混沌、零散状态,亟需进
目的:在中医学和西医学理论指导下,基于经典测试理论和现代测试理论,遵照国际最新的量表研制理念和流程,建立基于计算机自适应测试的胃痞患者报告结局量表[Patient Reported O