面向动态环境的多标记特征选择算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:shyibow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记特征选择一直是数据挖掘领域中数据预处理的关键技术之一。随着互联网技术的高速发展,多标记数据在各个领域以在线的形式持续增长,使得多标记数据呈现出了高维性和动态性。多标记数据的动态性常表现在数据特征空间或标记空间不是或不能事先给定,而是随着时间的推移不断地被获取。因而,数据特征空间或标记空间的动态性给传统静态的特征空间或标记空间下的多标记特征选择算法提出了诸多新问题和新挑战。为了探索动态特征空间或动态标记空间下的多标记特征选择问题,本文以流特征(Streaming Features)的概念来建模动态特征空间,以流标记(Streaming Labels)的概念来建模动态标记空间,开展了面向动态环境的多标记特征选择算法研究,主要研究内容和创新点如下:1.针对多标记数据特征空间动态性和高维性的问题,提出一种新颖的多标记动态流特征选择算法OM-NRS。该算法在邻域粗糙集的框架下,首先泛化传统邻域粗糙集模型以适合多标记学习,并提出一种正域的快速计算方法。其次,根据依赖度函数分析特征的相关性,同时设计特征两两成对比较的策略来过滤冗余特征。在不同领域的数据集上进行了大量的仿真实验,结果表明与目前流行的多标记特征选择算法相比,OM-NRS算法不仅可以有效的降低特征空间维数,而且能够以较小的特征子集获得更高的多标记分类性能。2.针对现有利用邻域粗糙集进行多标记动态流特征选择的方法忽略了标记空间的整体性,且在邻域模型中不同的邻域参数设定往往会导致特征选择结果不稳定性的问题,提出基于自适应邻域粒化和粗糙逼近的多标记动态流特征选择算法ASFS。该算法利用相似样本的分布信息给出样本的自适应邻域粒化策略,构建多标记数据的粗糙逼近机理。在此基础上,根据重要度函数设计重要选择和子集更新的动态流特征选择框架。所提模型通过自适应粒化策略,有效解决了邻域模型中邻域粒度选择问题。仿真实验表明,ASFS算法不仅优于静态的多标记特征选择算法,同时与目前流行的多标记动态流特征选择算法相比,ASFS算法的分类性能得到了明显的提高。3.针对现有的多标记动态流特征选择算法忽略了特征空间存在组结构的问题,提出一种基于组结构的在线多标记动态流特征选择算法OMGFS。该算法的实现具体包括组特征选择和组间特征选择。在组特征选择阶段,基于互信息给出一种新的特征评估准则来度量特征组与标记集合的相关性,选择具有强相关的特征组;在组间特征选择阶段,根据交互信息赋予特征权重来度量特征组之间特征的冗余性和交互性,以此从不同特征组中选择最优的特征子集。通过对不同领域的多标记数据进行大量实验和对比分析,结果表明OMGFS算法优于基于单特征评估的多标记特征选择算法。4.针对现有的多标记特征选择算法通常是假设训练样本的标记空间是已知的,忽略了现实任务中标记是随着时间推移不断被获取的问题,提出基于动态流标记类属特征学习的多标记特征选择算法FSSL。该算法的实现具体包括类属特征学习和类属特征融合。在类属特征学习过程,通过设计类间鉴别和类内邻域识别的策略来学习每个新到达标记的类属特征。在类属特征融合过程,将构建特征映射策略来融合已到达所有标记的类属特征。所提模型为动态流标记下的多标记特征选择研究提供了一个新的方案。通过对多标记数据集进行大量实验和对比分析,结果验证了 FSSL算法的有效性。
其他文献
随着养殖产业的发展和人们生活水平的提高,人们对猪肉质量的要求越来越高,但在猪群养殖规模不断扩大下,猪链球菌病的发生概率也在随之上涨。基于此,为保证猪群养殖效益,满足人们对猪肉的质量要求,本文分析猪链球菌病的发病特点,以此为基础研究防控猪链球菌病的有效措施,以期为相关工作提供参考性建议。
一年多来,我国各地的乡镇(街道)社工站建设得到了较快发展,我国社会工作事业的发展迎来了新的发展机遇,同时也对如何建设好乡镇(街道)社工站和社会工作服务体系提出思考,需要在把握机遇和把准发展方向上进一步明确思路,推进工作。其中,专业化发展方向问题尤为重要。现在全国乡镇(街道)社工站的建设,有的是在乡镇(街道)建立相对独立的、以当地人员为主的社工站;也有一些地方通过购买服务方式让已有的本地社会工作服务
期刊
目的 通过检测子宫内膜增生(EH)及子宫内膜癌(EC)患者血清中Apelin表达水平,分析其与EH/EC发病之间的关系,为EH/EC的发病机制提供新的研究依据。方法 选取2018年3月至2019年10月因异常子宫出血或超声异常就诊于天津医科大学总医院,病理结果诊断为EH/EC的患者34例为EH/EC组;选取同期因宫腔粘连或助孕检查就诊,病理结果诊断为增殖期或分泌期子宫内膜者49例为对照组,收集相关
社工这一概念源自于西方社会体系,全称为社会工作,指的是通过专业工作技能对弱势群体进行科学帮助的一种助人活动,社会工作者则是专职从事社会工作的群体,他们的主要目的就是帮助他人有效适应社会环境并具备自身的社会功能,以此缓解或改善一定的社会问题,由此可见,社会工作是现代社会公共服务不可或缺的重要力量,在促进社会发展方面能够起到关键性作用。社会工作作为国家处理社会问题的一种重要手段,在国际社会环境中主要用
期刊
目前,在Linux环境下,大部分嵌入式软件调试工作都是基于命令行实现。本文通过分析Eclipse的插件体系结构和扩展点机制,以及CDT、MI与gdb通信的原理构建出以Leon3嵌入式开发板为目标板,Arcdsu为网关软件,Eclipse为平台的可视化调试环境。既保证调试器能够进行远程调试,又能满足开发人员对图形化界面的要求。
输卵管间质部妊娠(interstitial ectopic pregnancy)是受精卵着床于输卵管间质部的妊娠。临床上少见,约占输卵管妊娠的3.2%[1-2]。输卵管间质部妊娠疾病初期无明显症状、体征,具有隐蔽性,自然发展结局多为输卵管间质部妊娠破裂,一旦破裂患者短时间内可陷入失血性休克状态,病情极其凶险,病死率高达2%~3%[3]。由于输卵管间质部妊娠发病率低,临床相对少见,误诊率较高,且常与
在推进乡镇(街道)社工站建设的过程中,广西壮族自治区柳州市把“统筹规划、延伸网络、人才培养、专业服务”作为最大特色和亮点,重点消除社工站建设的堵点、断点、痛点和弱点,灵活撬动政府部门、群团组织和社会组织等各方资源,把推进乡镇(街道)社工站建设融入乡村振兴和基层社会治理创新大局,社工站建设呈现良好发展势头。
期刊
在课堂教学实践中,提前设计好驱动问题,以问题贯穿整个教学过程,促使学生在分析、研究与处理问题的过程中收获知识和技能,使其逐渐形成解决问题的能力。在整本书教学中,如何激发学生保持长时间的阅读兴趣,深入思考文本内容,汲取精神营养,设计好驱动性问题就显得尤为重要。在阅读的不同阶段,设置驱动性问题的侧重也要不同。
2020年初,广西壮族自治区民政厅在全区9个市建立110个乡镇(街道)社工站,三江侗族自治县作为试点县,在全县10个乡镇建立起社工站。2021年,三江县着力把乡镇(街道)社工站作为强化民生兜底保障、助力乡村振兴、培养社会治理人才的平台,全力发动、全面覆盖,建成1个县级指导中心、15个社工站,成为柳州市首个实现乡镇社工站全覆盖的县。三江侗乡走出了一条从“无”到“有”、从“有”到“好”的社会工作发展路
期刊
近年来,江苏省苏州市坚持把发展社会工作、推进社工站建设作为基层治理的重要抓手,围绕“强导向、强运行、强体系、强融合、强品牌”,不断发展具有苏州特色的社工站建设“五强”模式,激发基层治理活力、提升基层治理水平。2021年底,苏州实现乡镇(街道)社工站全覆盖。今年,为进一步加强党对社会工作的全面领导,推进基层社工站标准化建设,以高质量党建引领社会工作高质量发展,苏州市民政局联合市委组织部下发《关于开展
期刊