基于互信息和多目标粒子群优化的特征选择方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:xtmpjordan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集和存储技术的发展,各领域数据呈现大规模、高维度的特点,然而,这些数据中往往存在大量噪声,不仅增加了学习任务的难度而且很容易造成过拟合问题。因此,在训练学习器之前对数据进行特征选择至关重要。多目标粒子群优化算法(MOPSO)由于其收敛速度快、实现简单等特点,被广泛应用于解决多目标特征选择问题。然而,大多基于MOPSO的特征选择方法在搜索过程中忽略了特征与样本类别之间隐含的相关信息,导致最终选择特征可解释性较差,而且MOPSO算法本身仍存在一些缺陷。因此,本文在对MOPSO算法进行改进的同时将特征数据的先验信息融合到粒子群搜索过程中,能够有效地选择关键特征,降低特征维度。本文主要的研究内容包括:(1)提出一种基于角度引导MOPSO和特征-标签互信息的特征选择方法(AGMOPSO-MI-FS)。一方面,为了选择与样本类别相关的特征,增强所选特征的可解释性,提出一种基于特征-标签互信息的自适应阈值设置策略,从原始数据中提取特征先验信息并将其编码到特征选择过程中。另一方面,为了提高MOPSO算法的搜索能力,提出一种角度引导的MOPSO算法(AGMOPSO),采用基于最小角距离信息的全局最优选择策略来引导种群向Pareto前沿收敛。最后,将特征-标签互信息耦合到AGMOPSO的粒子编码过程中来进行特征选择,在保证算法的收敛性和解的多样性的同时有利于筛选出与样本类别高相关的特征。在6个基准数据集上的实验结果表明,相比于现有多目标特征选择方法,AGMOPSO-MI-FS所获得的特征子集在提高分类准确率和降低特征数量方面均表现出一定的优越性,同时也增强了所选特征的可解释性。(2)提出一种基于混合扰动MOPSO和特征组-标签联合互信息的特征选择方法(HPMOPSO-JMI-FS)。为提高MOPSO算法的搜索性能,采用基于参考向量和角距离信息的全局最优选择策略,并提出一种基于特征频率的混合扰动策略以帮助停滞粒子跳出局部最优。另外,针对大多特征选择研究仅考虑单个特征与类标签的相关性和特征之间的冗余性,忽略特征组合交互后整体对分类系统影响的问题,提出一种基于特征组-标签联合互信息的精英粒子再学习策略,在进一步筛选与类标签高相关特征的同时选择性剔除冗余特征。在4个基准数据集和3个高维肿瘤数据集上的实验结果表明,相比于现有的多目标特征选择方法,HPMOPSO-JMI-FS不仅能获得一组分类错误率低且特征数量少的高质量特征子集,而且在高维小样本肿瘤数据集上也能够获得较好的分类性能。
其他文献
巨型炸弹是重量超过500千克的大型航空炸弹的俗称。9月12日,俄罗斯宣布成功测试了一枚当今世界上威力最大的常规炸弹,俄方称其为"炸弹之父"。据俄方公布的资料,这枚炸弹采用了最新的技术,杀伤半径超过300米,比美国的巨型炸弹"炸弹之母"还要利害。虽然它们被叫作"炸弹之父""炸弹之母",实际上,作为巨型炸弹它们却是小字辈,让我们上溯到二战,看一看巨型炸弹家族的家谱,了解一下这种让人难以想象的超级炸弹的
期刊
目的 分析笔者医院药学实习带教管理现状,总结问题,提出整改建议。方法 根据笔者医院近年来药学实习带教管理实际情况,参考相关资料,从带教与考核形式、带教老师老师知识与能力、带教目标和规划、实习生自身问题分析带教工作中常见问题。结合问题提出解决措施。结果 带教工作常见问题有:带教形式传统,考核形式单一;带教目标不明确,内容规划欠合理;实习生自身缺乏临床知识、实习生适应能力较差、实习生自助管理能力缺乏。
[研究目的]分析战略决策制定过程的情报需求,为面向战略决策支持的情报创新发展提供指导。[研究方法]在战略决策过程理论指导下,分析各过程的基本任务,进而探究各任务中的情报研究,基于此明确情报需求层次,进而构建情报需求模型。[研究结论]战略决策制定中的情报需求,在结构上形成了对情报的特定、线性和场景化的需求;在内容上形成了对情报的揭示真相、洞察形势和开发产品的需求;在功能上,对情报形成了获取证据信息、
近年来,随着我国残疾人数量的逐年递增,且轻度残疾妇女占比扩大,其自我认知问题备受关注逐渐成为社会工作领域的焦点话题。自我认知问题伴随一个人的终身,即使是轻度残疾妇女也有提升自我认知,增强自我认同的必要。本文以北京市Q镇温馨家园的轻度残疾妇女为研究对象,以优势视角理论为基础,运用访谈法、参与式观察法,整理归纳Q镇温馨家园的轻度残疾妇女自我认知现状,并从个人、家庭和社会三方面入手,分析轻度残疾妇女自我
为解决合成高固含量氯氧化铋(BiOCl)晶体时易产生晶体碎片和团聚的问题,以聚乙二醇单甲醚-b-聚甲基丙烯酸N,N-二甲基氨基乙酯为分散剂,制备了高固含量(10%)、分散性优异的正方形BiOCl晶体。以其为珠光颜料,自制的水性聚氨酯(WPU)乳液作黏合剂,制得了具有不同层次珠光效果的织物珠光印花涂层。用光学显微镜、激光粒度仪和XRD考察了BiOCl晶体的形貌、粒径分布和结晶度,并考察了珠光印花涂层
变应性鼻炎(AR)是耳鼻咽喉科的一种常见病、多发病,由于病程迁延、易反复发作,不仅会影响患者身心健康和生活质量,还会加重社会医疗卫生负担。尽管目前临床上AR的治疗手段繁多,部分患者仍然难以获得满意疗效。近年来,随着对AR发病机制的深入研究,非特异性免疫治疗逐渐受到临床医生们的重视。该文就近年来非特异性免疫治疗在AR上的临床应用进展做一综述,以期为更深入的研究提供参考。
节能环保施工技术应用于建筑工程施工建设之中,对于能源资源的节约有着重要作用。在本文中,主要结合某工程施工建设实际案例,对建筑工程建设中节能环保施工技术的运用以及具体措施进行了研究与探讨,仅供参考。
新时代背景下,环保节能理念深入人心,如何将色节能施工技术应用于建筑工程施工中,成了行业需处理的重要问题。基于此,文章先对绿色节能施工技术进行概述,然后对绿色节能技术应用的重要性与注意事项进行探析,最后对建筑工程绿色节能施工技术实际应用及提升策略进行研究,以供参考。
现阶段,随着我国化工产业的全面发展,化工企业数量不断增多,充分带动我国经济的总体增长,但化工事故发生频率逐渐提升。针对化工设计安全问题进行有效研究,简要介绍了化工工程设计概述。然后分析了化工工程设计安全问题的具体内容,如,工艺设备、设计资料、厂址布局等。最后着重探讨了解决化工工程设计安全问题的主要对策,包括强化设备安全控制、加强资料收集整理等。
为了提高氧化铁黄颜料在有机介质中的分散性能,采用钛酸酯和铝酸酯偶联剂复配对其进行表面改性。通过扫描电子显微镜(SEM)、X射线衍射(XRD)和傅里叶变换红外光谱(FT-IR)等检测设备对合成样品进行表征。结果表明:表面改性未改变氧化铁黄颜料晶体结构,但氧化铁黄颜料表面明显具有有机改性基团。在温度为50℃,钛酸酯偶联剂用量为11%,反应2 h条件下,改性后氧化铁黄的吸光度值达到0.925,明显高于氧