基于改进遗传算法的特征选择方法研究与应用

来源 :兰州大学 | 被引量 : 1次 | 上传用户:hc_z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着科学技术的发展,人类逐步进入大数据时代。所产生的的数据量每年以指数级增长,大量的数据对于人类的发展也起到了十分重要的作用。数据量的不断增加导致从数据中提取到的特征的数量也在增加,如何有效利用与处理数量如此庞大的特征数据既是机遇也是挑战。特征选择是一种很常见的用于除去冗余与无效的特征的方法。但是一些常见的特征选择方法通常会有一些缺点,例如基于Filter特征选择算法得到的特征子集在使用分类器进行分类的时候得到的准确率较低;一些采用随机搜索策略的特征选择方法,例如基于遗传算法的特征选择方法又会出现早熟等问题。所以,针对上述特征选择出现的问题,本文开展了如下的研究:1.提出一种改进的基于遗传算法的特征选择方法IMPGA。该算法针对遗传算法可能会出现早熟收敛的缺点,采用多个种群协同进化,每个种群使用不同的交叉及变异概率的方式,从而平衡遗传算法的全局和局部搜索能力。为了防止种群中出现超常个体主导种群进化,本文改进了遗传算法的选择算子和移民算子。在选择算子中引入了人工免疫算法中浓度的概念,选择操作从个体的适应度和浓度两方面进行考虑;同时,重新设计了计算个体浓度的方法,即从空间和浓度两方面考虑个体是否相似,从而计算个体浓度。在移民算子的改进中,首先通过交叉选优操作选择出优秀个体,然后将优秀个体与目标种群的每一个个体进行相似度评价,之后结合适应度和相似度进行优秀个体与目标种群个体的替换操作。2.将改进过的特征选择方法IMPGA在UCI上的9个公开数据集上进行验证,同时与两种经典的Filter特征选择算法以及两种Wrapper特征选择算法做对比。实验结果表明,IMPGA取得更好的特征选择效果。3.将IMPGA应用到抑郁症的识别以及有效特征选择当中。首先,提取五段音频刺激下脑电信号的96组特征,之后使用IMPGA对96组脑电特征进行筛选,选出更加有效的特征组合从而提高抑郁症的识别准确率。实验结果表明,和文中相关文献相比较,该算法可以取得更好的分类准确率以及选出有效的相关特征。
其他文献
目的:本研究的目的旨在探讨急性ST段抬高型心肌梗死(STEMI)患者出现碎裂QRS波群(fQRS)的危险因素分析和fQRS对急性STEMI院内并发症和不良事件的预测价值。方法:本研究是一项回顾性、单中心的观察性研究。收集兰州大学第一医院心脏中心CCU从2019年1月-2019年12月收住的STEMI患者742例,根据纳入和排除标准,最终纳入588例患者。fQRS的诊断标准采用窄fQRS的诊断标准,
论文立足于新物质主义转向的理论背景,发掘拉图尔物性思想的美学内涵。基于拉图尔对现代二元论的批判以及对物与人、物与物、人与人相互连接的新型关系的擘划,其物性思想在本体论层面具有美学亲缘性。通过选择其中具有逻辑递进关系的相关向度,分别从批判认识论美学、艺术、物和新感性以及构成共同世界三个方面展开研究。现代性问题始终和对“物”的理解分不开。不同于将现代性在时间维度上理解为同过去的断裂,拉图尔声称现代线性
目的:回顾性分析脓毒血症患者常规的实验室指标的变化,探讨这些指标与病情严重程度的相关性,以及对患者预后的诊断价值,为脓毒血症的诊治、病情的进展及预后判断提供依据。方法:1.收集兰州大学第一医院2017年7月-2020年6月期间收治的106例脓毒血症患者及同时期80例SIRS患者的临床及相关实验室检测资料;2.根据病情分为一般组、严重组与休克组;根据患者的预后转归,分为预后不良组与预后良好组。3.采
敦煌壁画是丰富的形象史料。敦煌石窟中有坐禅、燃灯、绕塔等佛教日常行事图像。坐禅图像可能是僧人日常修行的反映,也可能是僧团在进行冬夏安居的写照。燃灯图像的意涵包括燃灯供养和节日燃灯。礼忏祈福是绕塔图像的主要涵义。敦煌壁画中有讲经和授戒等法会图像,维摩诘经变是对讲经法会中法师讲法、都讲问难、听众听讲等仪式的图像折射。莫高窟第323窟可以反映出授戒法会有设置坛场、请师、问遮忏悔、宣示戒相等仪式。浴佛节、
目的:本研究通过对VBD患者的临床资料进行汇总分析,旨在提高人们对于VBD的认知,寻找防止VBD发生临床症状的二级预防措施。探讨VBD合并脑梗死的临床特点以及VBD合并急性脑梗死(ACI)的危险因素,为临床诊疗工作提供思路。方法:选取自2018年09月至2020年09月在兰州大学第一医院经头颅CT、CTA或MRI、MRA确诊为VBD的患者89例作为病例组,病例组患者根据有无临床表现分为症状组50例
DNA是由脱氧核苷酸组成的一种生物大分子,它通过氢键、范德华力、疏水作用以及静电等非共价相互作用和不同目标分子形成不同的高级结构。同时DNA也是一种性能卓越的生物材料,在构建生物传感器中有许多独特的优势,如结构简单和设计结果可预测、易于化学修饰和合成等。DNA分子机器作为一种新兴的纳米技术能够响应外部信号刺激而产生类似于机器的运动并且实现信号的放大,已被广泛应用于生物传感器的设计中。癌症是医学中常
疏勒河中下游地区位于河西走廊西部。该地区新石器时代至早期铁器时代人类活动经历了西城驿文化、四坝文化、骟马文化三个时期。本文系统梳理了此三支考古学文化的研究简史、典型遗址、分布范围、分期和年代以及文化面貌等。本文认为史前时期该地区环境变化与人类活动的影响是相互的。西城驿文化和四坝文化时期,气候日趋干冷,人群迫于生产压力,发展麦类/粟黍-畜牧业的混合经济,并从事青铜冶炼业。骟马文化时期气候一度湿润,草
稀疏约束模型是近年来的热点研究方向之一,主要被应用在机器学习和模式识别的领域,如人脸识别、目标追踪、高频遥感影像分类等。从相关的研究中可以得出稀疏约束的两大优势:提高模型的鲁棒性和提取高维数据的有效分类特征。为了提高稀疏约束的迭代效率,研究者们提出了新颖的基于协同约束的模型。协同约束模型在保留原有优势的基础上,大幅度地提升了计算速度,并且在人脸识别应用中取得了令人满意的结果。在实际应用中,人脸识别
在人类思想理论的历史卷轴中,马克思主义的出现是浓墨重彩的一笔。马克思的理论思想是被一次又一次的现实问题千锤百炼,被实践多次检视过的真理,是帮助人类对世界进行认知过程和改造过程的重要武器。在完整且成体系的马克思主义理论大框架中,拜物教批判理论具备不可替代的理论与现实意义。马克思对原始拜物教的研究及对资本主义社会中的拜物教现象的批判,是其提出剩余价值论从而揭示资本主义虚假面具的来源,拜物教批判理论由此
信道均衡作为一种用于数字通信系统中的抗衰落技术,被广泛应用在现代通信中。自适应均衡技术通常需要发送训练序列用以训练均衡器抽头系数,造成了一定的资源浪费。因此,不需要发送训练序列的盲均衡技术逐渐受到研究人员的青睐。近年来,随着机器学习(Machine Learning,ML)的蓬勃发展,基于机器学习理论的盲均衡方法得到了普遍的关注。在现有基于机器学习理论的盲均衡方法中,支持向量回归(Support