代价敏感特征选择问题研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:ylfxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据维度在许多应用领域的不断增加,特征选择作为避免维度灾难、增强模型泛化能力的一个重要步骤,正受到越来越多研究者的关注。现有的大多数特征选择方法聚焦于特征选择过程对模型性能带来的提升,而忽略了获取特征本身需要花费相应的代价这一实际情况。以医生诊断患者病情为例,患者所做的每项医学检查对应着不同的费用,所得到的检查结果可以视为不同的特征值。病人往往希望以最少的花费(或检查步骤)治疗好疾病。我们称这类考虑了特征代价不同的问题为代价敏感特征选择问题。为了能够以较低的特征代价达到具有可比性的模型性能,实现特征代价和模型性能之间的平衡,本文在以下两方面做了相关的研究工作。首先,针对高维数据的代价敏感特征选择问题,本文提出一种基于分层随机森林的代价敏感特征选择方法。这种方法不同于传统的两步特征选择法,而是在构造每棵决策树时,将特征代价参与到节点分裂过程中来,即,在寻找最优特征时兼顾特征性能和特征代价。同时,使用分层采样的方法加强了在处理高维数据时特征子集的分类能力,进而提升了每棵决策树的性能强度。本文通过一系列的实验验证了所提方法的有效性和稳定性。其次,针对按步骤选择特征的问题,本文将特征获取与模型构建结合起来,将代价敏感特征选择问题形式化为一个序列式特征获取问题。针对以往方法的不足,本文提出了一种基于强化学习的自适应序列式代价敏感特征获取方法。具体地,本文采用一个强化学习智能体来引导特征获取过程,让循环神经网络的结构因不同的样本而变化,使得模型能够针对不同样本采取不同的处理方式,从而对每个样本取得特征代价和模型性能的平衡。同时,由于该方法打破了模型固定结构的限制,因而增加了方法的实用性。实验结果表明,与其他常用方法相比,本文所提的方法能够以更低的特征代价实现相似的学习准确率。
其他文献
核磁共振是分析物质化学组成、分子结构重要方法之一,能够提供氢原子的化学位移、标量耦合等信息。其中,测量氢原子的标量耦合常数是核磁共振波谱研究的重要课题。在一维谱中,由于拥挤的谱峰和复杂的耦合关系,化学位移和标量耦合常数经常难于测量。近年来,为了准确测量标量耦合常数,科研工作者提出来很多选择性测J的二维谱方法。然而,在大多数选择性测J的二维谱方法中,通常需要用到梯度编码技术。而梯度编码技术的应用降低
减反射玻璃在汽车、光伏、显示、建筑等支柱产业有大量的应用需求。理论表明,具有梯度折射率结构是减反射膜获得优异减反射性能的最佳选择,而刻蚀法是制备该结构最简便且低成本的方法。本文以络合物为刻蚀液主要成分,采用全新的刻蚀液配方,通过水热法刻蚀玻璃制备出了性能优异的减反射玻璃。本文通过对比不同络合能力的刻蚀液实验结果,借助多种表征手段,重点研究了含络合物的刻蚀液刻蚀玻璃的机理。文章进一步探究了刻蚀温度、
荧光硅纳米粒子(Silicon nanoparticles,SiNPs),是一种新型的半导体荧光纳米材料。由于其制备原料价廉易得,具有无毒无害、生物相容性好等优点,因此,硅纳米粒子在分析检测、生物医学、荧光成像等领域具有广阔的应用。本论文中,制备了一种高量子产率且合成产率高的SiNPs。验证了SiNPs的低毒性,证实了SiNPs同时适用于体外以及在体的生物成像,尤其适用于长程生物成像。并以SiNP
目前手足口病主要流行于亚太地区,患者多为婴幼儿,其病症表现为大量疱疹出现在手掌、脚掌以及嘴周围皮肤等部位并伴有高烧发热。EV71是引发手足口病的主要病原体之一,与其他手足口病病原体不同的是EV71常引发重症手足口病,重症患者伴有神经系统并发症,有较高的死亡率。而目前还没有针对EV71有效的抗病毒药物。EV71的2C蛋白具有解螺旋酶活性,并参与了诸如病毒脱壳、细胞膜重排、RNA复制、免疫逃逸和病毒的
闽江是福建省最大的河流。闽江口及附近海域是福建省高渔业生产力水域之一。至今对闽江口及附近海域渔业资源和游泳动物群落的相关研究资料仍然不足。本研究旨在充实这些数据,为今后渔业资源可持续开发、利用和保护提供重要的参考依据。根据2017年和2018年为期两年每年四个季度的11个站位(3个为闽江入海口海域、8个为近外海海域)底拖网渔业资源调查,掌握闽江口及附近海域渔业资源密度,并评估20种鱼类和虾类的资源
图像处理的先进方法有很多。除了利用传统的概率知识,偏微分方程以及变分方法来进行图像处理以外,深度学习也是图像处理的一个重要的方法,例如利用神经网络进行图像去噪,分类以及图像复原。深度学习利用神经网络来直接从数据中学习有用的特征。本文旨在创建一个合适的神经网络对一维分段常量图像进行图像去噪并学习神经网络是如何从图像数据中获取信息并达到预期效果的。分析各个参数对网络性能的影响并利用可视化手段深入理解卷
锗磷酸盐是锗酸盐与磷酸盐的交叉研究领域,它不仅具有结构多样性,还具有优异的物理和化学性能,如固态电解质,非线性光学性质等。已报道的锗磷酸盐化合物大多具有三维架状结构,一维链状和二维层状结构的低维结构锗磷酸盐化合物不多。本文以锗磷酸盐作为研究对象,采用溶剂热法合成了一系列具有低维晶体结构的碱金属/碱土金属锗磷酸盐,旨在探究锗磷酸盐化合物的合成规律、解析化合物的结构特点。主要的研究内容如下:1.通过溶
在近几年来的研究中,靶向药物越来越受到人们的重视,而作为靶点之一的核受体更是备受关注。实验室前期研究发现核受体TR3在抑制炎症及抗肿瘤方面发挥着重要作用。同时在针对伞形科植物的提取分离研究中发现,伞形科植物中含有具有靶向核受体TR3抗肿瘤及抗炎的活性成分。本研究针对伞形科植物茶芎进行提取分离,意在筛选出可以靶向核受体TR3发挥抗肿瘤或抗炎活性的先导化合物。本次研究借助多种提取分离手段,从伞形科植物
高效利用丰富的可再生生物质制备化学品和燃料对于解决能源和环境问题意义重大。纤维素作为最丰富木质纤维素组分之一,含氧量丰富,将其选择性转化为高附加值含氧化学品符合原子经济性。本论文主要开展了纤维素制乙醇及纤维素衍生物葡萄糖二酸脱羟基制己二酸的研究,并取得如下主要结果:1.研制了氧化锆负载铂纳米颗粒(Pt/ZrO2)催化剂并将其与H2WO4耦合实现了纤维素特定C-C和C-O键活化断裂制得乙醇。在523
天然气水合物是一种具有笼型结构的非化学计量的类冰状结晶化合物,俗称“可燃冰”。自然界的水合物主要由甲烷气体和水分子在低温高压的环境中形成,因此通常存在于深海沉积物和常年冻土地区。水合物被认为是未来的潜在能源,引起了世界各国的广泛研究。除了作为一种新型的开采能源外,水合物独特的分子结构,也涉及了许多热点研究问题,如实现气体储存、分离以及运输等。因此关于水合物的形成过程和稳定性的研究引起了各国学者的关